fbpx
Los avances de la IA Los avances de la IA

Los avances de la IA!

Multimodalidad, IA constitucional y Texto a video, son los avances mas notables de la IA del pasado año 2023!

El 2023 fue el año en que los chatbots se volvieron muy virales por primera vez y también ha sido el año en que los gobiernos comenzaron a tomarse en serio el riesgo de la Inteligencia Artificial.  Por tanto, a continuación, le presentaremos los avances de la IA durante el año que termina. ¡No se los puede perder!

 

Estos son los avances de la IA que debe conocer

 

Primero que nada, debemos mencionar la multimodalidad, la cual viene siendo la capacidad de un sistema de Inteligencia Artificial para procesar muchos tipos diferentes de datos, no solo texto, sino también imágenes, videos, audio y mucho más.

 

El año pasado por primera vez el público obtuvo acceso a potentes modelos de Inteligencia Artificial multimodal. El GPT-4 de OpenAI fue el primero de ellos, permitiendo a los usuarios cargar imágenes y, así mismo, entradas de texto. Cabe acotar que GPT-4 puede “observar” el contenido de una imagen, lo que consigue abrir todo tipo de posibilidades, por ejemplo, preguntarle qué preparar para la cena basándose en una fotografía del contenido de su frigorífico.

 

Por su parte, el más reciente modelo Gemini de Google DeepMind, el cual fue anunciado en el mes de diciembre de 2023, también puede funcionar con imágenes y audio. Un vídeo de lanzamiento compartido por Google mostró al modelo identificando un pato basándose en un dibujo lineal en una nota adhesiva, así como otros aspectos.

 

Se debe señalar que la promesa de la multimodalidad no es sólo que los modelos se vuelvan más útiles. También es que los modelos tienen la capacidad de poder entrenarse con abundantes conjuntos de datos nuevos (imágenes, videos, audio) que contienen más información sobre el mundo que el texto solo.

 

La IA constitucional, y es que una de las mayores preguntas sin respuesta en Inteligencia Artificial es cómo alinearla con los valores humanos. Cabe acotar que, si estos sistemas se vuelven más inteligentes y poderosos que los humanos, podrían llegar a causar un daño descomunal a nuestra especie (incluso algunos pesimistas hablan de la extinción total) a menos que, de alguna manera, se vean limitados por reglas que sitúen el florecimiento humano en el centro.

 

El proceso que uso OpenAI para alinear ChatGPT (para evitar comportamientos racistas y sexistas de modelos anteriores) funcionó bastante bien pero, el mismo requirió una gran cantidad de trabajo humano, mediante una técnica conocida como “aprendizaje por refuerzo con retroalimentación humana” (RLHF). Los humanos evaluarían las respuestas de la Inteligencia Artificial y le darían el equivalente computacional de una golosina para perros si la respuesta fuera útil, inofensiva y cumpliera con la lista de reglas de contenido de OpenAI. Es de resaltar que, al recompensar a la IA cuando era buena y castigarla cuando era mala, OpenAI desarrolló un chatbot bastante eficaz y relativamente inofensivo.

 

Sin embargo, dado que el proceso RLHF depende en gran medida del trabajo humano, existe un gran interrogante sobre qué tan escalable es. Según se conoce, es caro. Está sujeto a los sesgos o errores cometidos por los evaluadores individuales. Se vuelve más propenso a fallar cuanto más complicada es la lista de reglas. Y así mismo, parece poco probable que funcione para sistemas de IA que son tan poderosos que comienzan a realizar cosas que los humanos no tienen la capacidad de poder comprender.

 

Vale la pena señalar que, la IA constitucional, descrita por primera vez por investigadores del principal laboratorio de IA, Anthropic, en un artículo del mes de diciembre de 2022 , intenta abordar estos problemas, aprovechando el hecho de que los sistemas de Inteligencia Artificial ahora son lo suficientemente capaces de comprender el lenguaje natural. Cabe acotar que, la idea es muy simple. Primero, escribe una “constitución” que establece los valores que le gustaría que siguiera su IA. Posteriormente, entrena a la Inteligencia Artificial para que califique las respuestas en función de qué tan alineadas están con la constitución y luego incentiva al modelo para que genere respuestas que obtengan una puntuación más alta. En vez de aprendizaje por refuerzo a partir de la retroalimentación humana, es aprendizaje por refuerzo a partir de la retroalimentación de la IA.

 

Por otra parte, también hay que hablar acerca de “Texto a vídeo”, del cual se tiene que mencionar que un resultado notable de los miles de millones de dólares invertidos en IA este año ha sido el rápido aumento de las herramientas de conversión de texto a video. El año pasado, las herramientas de conversión de texto a imagen apenas habían salido de su infancia; en la actualidad, hay varias empresas como OpenAI que ofrecen la posibilidad de convertir frases en imágenes en movimiento con niveles de precisión cada vez más finos.

 

Es importante destacar que otra de esas empresas es Runway , una startup de vídeos de inteligencia artificial con sede en Brooklyn que quiere hacer que el cine sea accesible para todos. Según se pudo conocer, su último modelo, Gen-2, permite a los usuarios no solo generar un video a partir de texto, sino que también permite cambiar el estilo de un video existente basándose en un mensaje de texto, en un proceso que llama video a video.

 

 

Deja un comentario