IMPRESIONANTE

La IA Vall-e es capaz de imitar una voz con solo escucharla durante 3 segundos

Microsoft ha desarrollado un software capaz de imitar cualquier voz tras haberla escuchado solo durante tres segundos.

Inteligencia artificialrawpixel.com para Freepik

La inteligencia artificial se ha ido desarrollando hasta el punto de poder crear imágenes, textos o código. Pero, además, si le "prestas" tu voz durante unos segundos también es capaz de imitar cómo hablarías en distintas situaciones.

Se trata de Vall-e, un software creado por ingenieros de Microsoft que imita las voces humanas. El modelo de inteligencia artificial ha sido entrenado con 60.000 horas de audio en inglés de narraciones de audiolibros. Sin embargo, para poder imitar una voz humana actualmente solo necesita escucharla durante tres segundos para imitarla.

A partir de esos pocos segundos de escucha, Vall-e es capaz de pronunciar palabras y frases como si fuera esa persona. Además, también puede preservar el ambiente acústico que había tras la voz, como barullo de gente o hablar como si estuviera en una conversación telefónica.

Otra de las características de Vall-e es que puede retener la emoción de las voces. Por ejemplo, si una persona habla durante tres segundos con tono alegre o muy enfadado, la IA lo registrará y todas las palabras o frases que se digan con esa voz las repetirá como si estuviera alegre o muy enfadado, dependiendo del tono de la persona.

Por el momento, Vall-e no es de uso público. Sin embargo, en su página web se pueden ver distintos ejemplos sobre cómo trabaja esta IA y cómo consigue imitar una voz con tan solo escucharla durante tres segundos.