NUEVA GENERACIÓN DE LA IA

Google estrena Imagen 2, la IA que genera imágenes igual o mejor que DALL-E

Gemini ya se hace notar también en la IA generativa para crear imágenes, e incluso para hacer resúmenes de varias de ellas.

Imagen 2Google

La revolución de la IA ha llegado a la ciudadanía en dos modalidades por encima de las demás. Por un lado, mediante los chatbots, que nos han permitido hablar con una inteligencia artificial como nunca lo habíamos hecho antes, y también a través de herramientas si cabe más sorprendentes, como son las que nos permiten crear imágenes a partir de un determinado texto. Este aspecto prácticamente lo ha monopolizado hasta ahora DALL-E, la inteligencia artificial para estos menesteres por parte de Open AI. Aunque ahora por fin cuenta con una alternativa a su altura, o incluso mejor.

Así es Imagen 2

 De esta forma ha llamado Google a su nueva IA desarrollada para crear imágenes fotorrealistas e ilustraciones a partir de nuestros deseos más extravagantes. No es algo nuevo, pero ahora sí que Google parece preparada para mirar de tú a tú a DALL-E, incluso en sus versiones más recientes, como es la 3. Y en lo que ha mostrado Google, podemos encontrar algunas características que hasta ahora no hemos podido disfrutar la mayoría de internautas. Y es que parece que esta nueva herramienta es capaz de mostrar imágenes no solo más realistas, sino que pueden contener textos determinados, sin recurrir a esos caracteres ininteligibles a los que nos ha acostumbrado OpenAI en los últimos meses.

Imagen 2 | Google

Desde Google han mostrado ejemplos que nos muestran objetos creados con esta tecnología, y que además muestran textos que se leen perfectamente, lo que ya da pie a obtener imágenes por ejemplo de un logotipo, o de cualquier rótulo con un texto perfectamente legible, sin tener que editar después las imágenes. Esta IA va más allá, ya que también funciona a la inversa, describiendo imágenes. Podremos mostrarle a la IA tres o cuatro imágenes, y pedirle que nos escriba un texto en el que se describa lo que aparece en ellas.

Desde luego lo que ha mostrado Google es muy potente, y muestra unas características que mejoran incluso a las que hemos visto en la IA de OpenAI, aunque esta se encuentra en plena actualización, y ya está implementando mejoras similares. Desde Google han querido también aclarar lo que pasará cuando una imagen creada por la IA tenga una clara inspiración en la obra de otro autor. Y es que en esos casos los de Mountain View aumentarán su cobertura para indemnizarles con una tarifa determinada. De esta manera las imágenes que claramente se hayan inspirado en otras pagarán igualmente los derechos que sean necesarios para poder divulgar la imagen.

Esta nueva generación de la IA visual de Google cuenta ya con todo el potencial de Gemini, que ha supuesto el verdadero salto de calidad de los de Mountain View a la hora de afrontar esta cruenta batalla con OpenAI. Ahora sí, a nivel visual Google tendrá una herramienta igual o más potente incluso que la de sus rivales. Eso sí, de momento no se ha liberado masivamente, y parece que todavía habrá que esperar para poder usarla, salvo que seamos un negocio o empresa.