Astronomía, divulgación, descubrimientos, ecología, innovación...
UNA IA REVOLUCIONARIA
La nueva IA de Meta promete hacer lo que ninguna de su competencia. Y es que no necesitará un aprendizaje previo para convertir cualquier texto en todo tipo de voces.
Si hasta hace poco el Metaverso parecía ser la panacea que nos llevaría a ciudadanos y a empresas a nuevas cotas sociales, ahora todo aquello parece haber quedado en una broma pesada al lado de lo que se nos viene ya encima con la IA. Y es que la inteligencia artificial ya está aquí, en sus diferentes formas. Y si en el último medio año hemos visto cómo los modelos de lenguaje nos han dejado con la boca abierta, ahora le toca el turno a los de voz. Google ya presentó algo similar a lo que ahora ha anunciado Meta, que es Voicebox, una IA que será capaz de convertir nuestros textos en voces de todos los tipos y tonalidades posibles.
Como decimos, en este corto periplo de la inteligencia artificial, hemos conocido no solo modelos de lenguaje avanzados que utilizamos en el día a día, sino también otros proyectos que nos brindan la posibilidad de plasmar nuestras conversaciones y textos en voces modeladas con gran realismo, y Voicebox de Meta nos ofrece algo similar, basando toda la IA generativa en crear archivos sonoros. Y ahora se trata de presentar proyectos de todo tipo, con numerosas variantes de la inteligencia artificial.
Por un lado, tenemos MusicGen, que se presentaba recientemente para crear música de manera sencilla con solo pedirle algunos detalles a la IA, como el que crea una imagen en Dall-e. En esta ocasión se trata de otra tecnología de IA que ha sido anunciada por Meta para demostrarnos todo el potencial que hay en este campo. Y concretamente se trata de una tecnología que destaca sobre otras en que no necesita ser entrenada antes de convertir los textos a una voz o a varias diferentes.
Este es un aspecto clave, ya que reduce mucho el proceso de creación de los contenidos en forma de voz. El proceso es sencillo, solo hay que escribir un texto, y Voicebox lo convertirá en una voz. O también podremos elegir otras diferentes donde adaptar esas palabras. Por lo que será muy sencillo insertar estas voces en un vídeo diciendo lo que queremos, como si de una locución profesional se tratara, esperemos que esto no acabe con más sectores de empleo.
En su vídeo de demostración, Meta nos muestra cómo es capaz de convertir un texto a un total de seis tipos de voces diferentes, lo que sin duda nos da una idea del poder de transformación de la letra en voz que tiene esta IA. Por tanto, es un modelo muy avanzado de inteligencia artificial que ya está en disposición de poner cualquier palabra en diferentes voces, y sin que intervenga un humano en el proceso. Eso sí, como era de esperar, y como ha ocurrido también en el caso de Google, de momento es solo eso, una demostración.
Y es que, a diferencia de lo ocurrido con LLaMA, la inteligencia artificial de Meta, no se compartirá el código fuente con nadie, ya que esta variante de IA de voz es especialmente peligrosa para los que buscan utilizarla con fines maliciosos, creando deepfakes de prácticamente cualquier persona, lo que nos metería de lleno en una espiral muy peligrosa, de la que los principales líderes de la industria intentan evitarnos.