fbpx

OpenAI publica su primer modelo capaz de “razonar”

Primer modelo capaz de razonar: “o1”.

OpenAI está lanzando un nuevo modelo denominado o1, el primero de una serie planificada de modelos de “razonamiento” que han sido entrenados para responder preguntas más complejas, más rápido que un humano. Según se informa, se lanzará junto con o1-mini, una versión más pequeña y económica.

Vale la pena destacar que, para OpenAI, o1 representa un paso hacia su objetivo más amplio de Inteligencia Artificial (IA) similar a la humana. En términos más prácticos, hace un mejor trabajo al escribir código y resolver problemas de varios pasos que los modelos anteriores, pero también es más costoso y más lento de usar que GPT-4o. OpenAI llama a esta versión de o1 una “vista previa” para enfatizar lo incipiente que es.

Primer modelo capaz de razonar: “o1”

Los usuarios de ChatGPT Plus y Team obtuvieron acceso tanto a o1-preview como a o1-mini a partir del día de ayer, mientras que los usuarios de Enterprise y Edu tendrán acceso a principios de la próxima semana. OpenAI señala que planea proporcionar acceso a o1-mini a todos los usuarios gratuitos de ChatGPT, pero hasta el momento, no ha establecido una fecha de lanzamiento. Es de resaltar que, el acceso de los desarrolladores a o1 es realmente caro; en la API, o1-preview cuesta un valor de $15 por 1 millón de tokens de entrada, o fragmentos de texto analizados por el modelo, y $60 por 1 millón de tokens de salida. A modo de comparación, GPT-4o cuesta $5 por 1 millón de tokens de entrada y $15 por 1 millón de tokens de salida.

El entrenamiento detrás de o1 es fundamentalmente diferente de sus predecesores, comentó el líder de investigación de OpenAI, Jerry Tworek, aunque la compañía no es muy precisa sobre los detalles exactos.

Señala que o1 “ha sido entrenado utilizando un algoritmo de optimización completamente nuevo y un nuevo conjunto de datos de entrenamiento específicamente diseñado para él”. 

OpenAI enseñó a los modelos GPT anteriores a imitar patrones de sus datos de entrenamiento. Con o1, entrenó al modelo para resolver problemas por sí solo usando una técnica conocida como aprendizaje de refuerzo, que enseña al sistema a través de recompensas y penalizaciones. Luego utiliza una “cadena de pensamiento” para procesar consultas, de forma similar a cómo los humanos procesan los problemas al analizarlos paso a paso.

Como resultado de esta nueva metodología de entrenamiento, OpenAI asevera que el modelo debería ser más preciso.

“Hemos notado que este modelo alucina menos. Pero el problema persiste. No podemos decir que hayamos resuelto las alucinaciones”, señala Tworek. 

Lo principal que diferencia a este nuevo modelo de GPT-4o es su capacidad de abordar problemas complejos, como codificación y matemáticas, mucho mejor que sus predecesores y, al mismo tiempo, explicar su razonamiento, según ha señalado OpenAI.

Ahora bien, en los concursos de programación en línea conocidos como competencias Codeforces, este nuevo modelo alcanzó el percentil 89 de participantes, y OpenAI afirma que la próxima actualización de este modelo funcionará “de manera similar a los estudiantes de doctorado en tareas de referencia desafiantes en física, química y biología”.

Un paso importante…

Vale la pena aclarar que, para los investigadores de IA, descifrar el razonamiento es un paso importante hacia una inteligencia de nivel humano. La idea es que, si un modelo es capaz de algo más que el reconocimiento de patrones, podría generar avances en áreas como la medicina y la ingeniería. Por ahora, sin embargo, las capacidades de razonamiento de o1 son relativamente lentas, no se parecen a las de un agente y su uso resulta costoso para los desarrolladores.

“Hemos pasado muchos meses trabajando en el razonamiento porque creemos que este es realmente el avance decisivo”, afirma el director de investigación de OpenAI, Bob McGrew. 

Así mismo añade, “Básicamente, se trata de una nueva modalidad de modelos para poder resolver los problemas realmente difíciles que se necesitan para progresar hacia niveles de inteligencia similares a los humanos”.

Deja un comentario