Veo, el último modelo de video con Inteligencia Artificial Generativa de Google, ya se encuentra disponible para que las compañías comiencen a incorporarlo a sus procesos de creación de contenido. Después de su primera presentación en el mes de mayo (tres meses después de que OpenAI hiciera una demostración de su producto competidor Sora), Veo se adelantó en el mercado al lanzar una vista previa privada a través de la plataforma de IA Vertex de Google.
Veo ya se encuentra disponible para que las compañías lo utilicen
Es crucial dar a conocer que Veo es capaz de generar videos de resolución 1080p de “alta calidad” en una variedad de estilos visuales y cinematográficos diferentes a partir de indicaciones basadas en texto o imágenes. Cuando se anunció el modelo por primera vez, estos clips generados podían tener una duración de “más de un minuto”, sin embargo, Google no especifica restricciones de duración para la versión preliminar. Algunos nuevos clips de ejemplo en el anuncio de Google están a la par con lo que ya hemos percibido de Veo: sin un ojo agudo, es extremadamente difícil darse cuenta de que los videos están generados por Inteligencia Artificial (IA).
Vale la pena destacar que la última versión del generador de texto a imagen Imagen 3 de Google también estará disponible para todos los clientes de Google Cloud a través de Vertex “a partir de la próxima semana”, ampliando así su lanzamiento inicial en Estados Unidos en Google AI Test Kitchen en el mes de agosto. Los usuarios en la lista de permitidos de Google también tienen la capacidad de poder acceder a nuevas funciones como la edición de fotos basada en indicaciones y la capacidad de “infundir su propia marca, estilo, logotipo, tema o características del producto” en las imágenes generadas.
Desde Google señalan que Veo e Imagen 3 tienen protecciones integradas para evitar que generen contenido dañino o que violen las protecciones de derechos de autor, aunque cabe aclarar que hemos descubierto que esto último no fue difícil de eludir. Todo lo producido por Veo e Imagen 3 también está integrado con la tecnología SynthID de DeepMind, una especie de marca de agua digital invisible que, según Google, puede “reducir los problemas de desinformación y atribución errónea”. Se trata de un concepto similar al sistema Content Credentials de Adobe, que se puede integrar en el contenido producido por los modelos de IA generativos de imágenes y videos del propio gigante del software creativo.
Lo cierto es que, ahora que el modelo de video de Google ya está disponible, OpenAI se encuentra notablemente por detrás de sus competidores y se está quedando sin tiempo para cumplir su promesa de lanzar Sora a fines del presente año 2024. Ya estamos percibiendo contenido generado por Inteligencia Artificial (IA) en anuncios como la reciente campaña navideña de Coca-Cola, y las compañías tienen un incentivo para no esperar a que Sora esté disponible: según Google, el 86% de las organizaciones que ya usan IA generativa están viendo un aumento en los ingresos.