Sundar Pichai, CEO de Google, habla en la conferencia de desarrolladores de E/S de Google.
Andrej Sokolow | Alianza de imágenes | Getty Images
Google El martes anunció VEO 3, un generador de video AI que también puede crear e incorporar audio.
La herramienta de inteligencia artificial compite con el generador de video SORA de Openai, pero su capacidad para incorporar el audio en el video que crea es una distinción clave. La compañía dijo que VEO 3 puede incorporar audio que incluya el diálogo entre personajes y los sonidos de animales.
«Veo 3 se destaca desde el texto y la provisión de imágenes a la física del mundo real y la sincronización precisa de los labios», dijo Eli Collins, vicepresidente de productos de Google Deepmind, en un blog el martes.
La herramienta Video-Audio AI está disponible el martes para los suscriptores estadounidenses del nuevo plan de suscripción Ultra de $ 249.99 por mes por mes, que se dirige a los entusiastas de la IA hardcore. VEO 3 también estará disponible para los usuarios de la plataforma Enterprise Vertex AI de Google.
Google también anunció Imagen 4, su última herramienta de generación de imágenes, que según la compañía produce imágenes de mayor calidad a través de indicaciones del usuario. Además, Google presentó Flow, una nueva herramienta de cine que permite a los usuarios crear videos cinematográficos describiendo ubicaciones, tomas y preferencias de estilo. Los usuarios pueden acceder a la herramienta a través de Gemini, Whisk, Vertex AI y Workspace.
Los últimos lanzamientos vienen a medida que las imágenes y el video se convierten en casos de uso populares para indicaciones generativas de IA. El CEO de Operai, Sam Altman, en marzo dijo que el generador de imágenes 4O de Chatgpt era tan popular que causó que las fichas informáticas de la compañía se «derritieran». La compañía dijo que tenía que limitar temporalmente el uso de la función.
Google tiene un historial mixto cuando se trata de sus generadores de imágenes AI. El año pasado, la compañía tuvo que relanzar su herramienta Imagen 3 después de que surgió resultados históricamente inexactos a las indicaciones de los usuarios, causando críticas generalizadas. El cofundador Sergey Brin dijo más tarde que el accidente se debió a la falta de «pruebas exhaustivas».
La compañía de Mountain View, California, también actualizó su generador de video VEO 2 para incluir la capacidad de los usuarios de agregar o eliminar objetos de videos con indicaciones de texto. Además, Google abrió su modelo de generación de música Lyria 2 a los creadores a través de su plataforma de Shorts de YouTube y negocios utilizando Vertex AI.
MIRAR: Google E/S: apuestas altas para el escaparate de IA









