Google presentó este martes su nuevo modelo de generación de video con inteligencia artificial (IA), denominado Veo 3, que por primera vez puede producir tanto video como audio, incluyendo música, efectos especiales y diálogos. Hasta ahora, las IA solo podían crear imágenes sin sonido.
Desde la conferencia de desarrolladores Google I/O en Mountain View, California, el vicepresidente de Google Labs y Gemini, Josh Woodward, afirmó: “Estamos adentrándonos en una nueva era de creación”.
Este avance en la herramienta de generación de video, según la compañía, mejora la calidad de Veo 2, lanzado este año para competir con modelos similares de OpenAI, y ahora incorpora la capacidad de generar videos con audio, como ruidos de tráfico, canto de pájaros o diálogos entre personajes.
Asimismo, Google anunció un nuevo modelo para generar imágenes con IA, llamado Imagen 4. La novedad de esta herramienta es su capacidad para interpretar y crear texto, una función que anteriormente era limitada en la IA.
La compañía destacó que Imagen 4 puede crear imágenes en distintas relaciones de aspecto, con resolución de hasta 2K, aptas para impresión o presentaciones, además de contar con mejor precisión en ortografía y tipografía, facilitando la elaboración de tarjetas personalizadas, pósteres o cómics.
Otra incorporación es Flow, un mecanismo para edición de cine basado en IA, que permite crear clips, escenas e historias cinematográficas.
Flow estará disponible hoy en Estados Unidos para los suscriptores de los nuevos planes Google AI Pro y Google AI Ultra.