Lyria 3 Lyria 3

Lyria 3: Gemini ya genera música!

Gemini estrena Lyria 3: crea música de 30 segundos con texto, foto o video. Pistas con voz, versos y estribillos.

Hubo un tiempo —no tan lejano— en el que hacer música era como entrar a una cocina profesional: o la persona que entraba sabía lo que hacía o mejor que ni se acercara este lugar, de lo contrario, podría terminar quemado!

Porque componer no es solo juntar sonidos. Es ordenar una historia: versos, ritmo, voz, coherencia…. Y ahí fue donde muchas inteligencias artificiales tropezaron al principio: sonaban como un loro con teclado. Mucho ruido, poca intención. La IA intentaba cantar… y a veces parecía que estaba leyendo una receta con melodía.

Pero ahora aparece Lyria 3 dentro de la aplicación de Gemini, y el cambio es importante: ya no se trata de “hacer ruidos bonitos”, sino de armar canciones con estructura real, con voces, versos y coros que puedan sonar creíbles (estamos en ese proceso). Dicho en términos más simples: parece que la Ia por fin entiende que una canción no es una frase repetida con tambor, sino un pequeño ritmo con principio, subida y cierre.

¿Y esto para qué sirve?

Para muchas cosas, desde crear música de 30 segundos para acompañar una publicación, generar un jingle para el cumpleaños de un amigo: rápido, personalizado y con esa gracia que le dice a la gente algo como: “esto lo hice pensando en ti”!

Y lo más interesante: no se necesita escribir toda la letra, Gemini puede generarla según lo que le pida. Antes el error era creer que “crear” era solo apretar botones.

Esto es clave. Las primeras etapas de la música con IA dejaron un aprendizaje: cuando una máquina no entiende la intención, inventa cualquier cosa. Y ahí vimos muchos errores: Gente pidiendo “una canción romántica” y recibiendo algo que sonaba a publicidad de detergente.

Peor aún, letras con frases raras, como si alguien estuviera soñando, hablando dormido, medio borracho o melodías que empezaban bien… y luego se perdían como cuando un humano tararea y se le olvida cómo seguía… pasa hasta en las mejores familias!

Lo que promete Lyria 3 es coherencia, que es una palabra elegante para algo simple: que la canción no se desbarate a mitad de camino. La dinámica es básica: “Escribir lo que se siente, subir una foto o un video”… y en poco tiempo se obtiene una pista de 30 segundos!

Vale aclarar que: la idea no es que componer una obra maestra, sino darle al usuario una forma nueva de expresarse y compartir algo rápido.

¿Y… si esto se usa para engañar?

Aquí viene la parte seria (pero necesaria). Toda pista generada en Gemini incluye SynthID, una marca de agua imperceptible para identificar que ese audio fue hecho por IA de Google. Y además lanzan una función para subir un archivo de audio a Gemini y preguntar si fue generado por su IA, verificando esa marca.

Resultados de la validación con SynthID
Resultados de la validación con SynthID

Esto importa muchísimo, sobre todo para el público mayor, porque hoy abundan los audios falsos y las imitaciones. Y si algo nos ha enseñado la vida es que cuando una herramienta se vuelve popular, siempre aparece alguien intentando usarla mal.

Deja un comentario