Adobe presenta una tecnología que permite alterar lo que ha dicho una persona o crear una frase nueva con su voz

Adobe ha presentado una tecnología que permite editar grabaciones de voz, de forma que puedes alterar lo que ha dicho una persona o crear una frase completamente nueva a partir de su voz, es decir, una especia de «Photoshop para audio.»

La tecnología, conocida como VoCo (Conversión de Voz), presenta al usuario una caja de texto. Inicialmente esa caja de texto muestra el texto del fragmento de audio, y puedes mover palabras, borrar fragmentos, o escribir palabras completamente nuevas.

Cuando tecleas una nueva palabra, hay una pequeña pausa mientras la palabra es generada, y después puedes escuchar el nuevo fragmento de voz.

VoCo funciona procesando una gran cantidad de datos de voz (alrededor de 20 minutos ahora, aunque esto mejorará), rompiéndolo en fonemas y tratando de crear un nuevo modelo de voz de la persona que habla – presumiblemente con características como la cadencia, los acentos, etc. pero Adobe no ha proporcionado muchos detalles.

Cuando editas la voz de alguien, VoCo busca esa palabra en algún sitio de los 20 minutos de grabaciones y, si la palabra no había sido pronunciada, es construida a partir de los fonemas. En el minuto 4:30 puedes escuchar cómo se construye la frase «three times» desde cero y, si escuchas con atención, suena un poco sintética pero no demasiado. Copiar y pegar palabras existentes funciona mucho mejor.

VoCo ha sido presentado en Adobe Max 2016, el lugar donde la compañía suele presentar las nuevas tecnologías uno o dos años antes de que sea comercializada. Si VoCo sale de la fase de prototipo, se añadirá probablemente a Adobe Audition.

Dejar un comentario

Tu dirección de e-mail nunca será publicada Los campos requeridos están marcados*

Esta web usa cookies para elaborar información estadística y mostrar publicidad personalizada.

Saber más