fbpx

ChatGPT: ¿Cómo llegamos hasta aquí con los modelos GPT?

Estos modelos GPT han logrado contar con una gran evolución en el campo del procesamiento del lenguaje natural.

Para nadie es un secreto que la IA y es un tema que esta cada día mas presente a nivel mundial, es por tal motivo, que en este post comentaremos todo lo relacionado con la evolución de Los modelos GPT de transformadores generativos preentrenados de la reconocida compañía de OpenAI.  Desde sus inicios con ChatGPT-1 hasta el actual ChatGPT-4. Para conocer cada detalle al respecto siga leyendo este post verdaderamente enriquecedor.

 

 

Los mejores datos acerca de la evolución de OpenAI

 

Pesé a las historias de Hollywood y el imaginario colectivo de todo el lujo, glamour y hasta la fantasía de las películas, la experiencia del comienzo de una startup es bastante miserable, y que en efecto, muchas personas tienden a darse por vencidas.  Sin embargo Altman no lo hizo tanto su resiliencia, como también su  determinación, lo llevaron a cofundar OpenAI con Elon Musk (si, la misma persona que tanto ha criticado a esta compañía) en el año de 2015.

 

Elon Musk
Elon Musk

 

OpenAI inició  como una organización sin fines de lucro pero, para bien o para mal, en el año de 2019 se convirtió en una empresa con fines de lucro. A pesar de este importante cambio, Altman siguió comprometido con el objetivo original de crear una IA beneficiosa. Esto deja ver como el fundador de una startup puede llegar a revolucionar una industria e incluso, impactar de manera positiva a la humanidad. Mientras Altman se encuentra en su gira mundial abogando por una coalición global para regular el desarrollo y uso de la IA, su historia consigue inspirar a los empresarios de todo el mundo.

 

Los modelos GPT

 

 

 

 

Es importante señalar que para poder profundizar un poco sobre cada modelo y sus aspectos técnicos, se debe dejar claro que es un modelo de GPT, por lo cual, hay que señalar que, un modelo de transformador preentrenado generativo (GPT), que utiliza otro Modelo de lenguaje Grande (en inglés LLM), para el aprendizaje automático y, de esa forma, poder generar en respuesta a las preguntas o comandos, texto similar al de un humano.

 

Cabe acotar que, los modelos GPT se entrenan previamente en un gran corpus de datos de texto y, posteriormente, se ajustan para tareas concretas como por ejemplo; la traducción, respuesta a preguntas, generación de texto u otros.

 

LLMs
LLMs

 

Pero, si hay algo que es necesario mencionar, es que estos modelos han logrado contar con una gran evolución en el campo del procesamiento del lenguaje natural, logrando permitir interacciones mucho más sofisticadas y matizadas entre los humanos y la Inteligencia Artificial.

 

Primeramente, hay que mencionar el GPT-1 fue presentado por OpenAI en el año de 2018, se trató del primer modelo de lenguaje construido sobre la arquitectura “Transformer”, la cual, dispone de un enfoque novedoso que utiliza mecanismos de autoatención. Para ser más exactos, GPT-1 logró ser un importante avance con respecto a los modelos de lenguaje de su época.

 

Este modelo se creó para predecir la siguiente palabra en una oración. Se trató de un enfoque que aunque parezca simple fue realmente efectivo, el mismo permitió que GPT-1 generara oraciones coherentes y contextualmente relevantes. Sin embargo,  según se pudo conocer, aún era necesario optimizar la comprensión de estructuras lingüísticas complejas y asimismo, el mantenimiento del contexto en pasajes más largos.

 

Luego llegó GPT-2 el cual fue lanzado en el año de 2019 y logró ser una evolución o  actualización sustancial de GPT-1. Este modelo logró demostrar una capacidad realmente impresionante para generar secuencias de texto lógicas y plausibles. Incluso, el mismo también podría imitar respuestas similares a las humanas, lo que sin lugar a dudas, lo convirtió en una herramienta muy valiosa para varias aplicaciones de PNL, en donde se incluye la generación y traducción de contenido. Pero, no todo podía ser perfecto, este modelo requería conservar la coherencia, así como también el contexto en pasajes más largos.

 

El GPT-3 por su parte, fue lanzado para el año de 2020 y logró marcar un período de crecimiento exponencial para los modelos de procesamiento de lenguaje natural. Este modelo por su parte, no solo se puede generar texto sino, que, también, se podría interpretar el contexto de un texto e incluso, generar respuestas relevantes,  así como también escribir código de computadora y asimismo, crear arte. Pero, cabe acotar que incluso este modelo siendo tan avanzado, generó preocupaciones sobre el posible uso indebido de modelos de lenguaje tan poderosos, con temores de que pudieran usarse para generar contenido perjudicial.

 

Ahora bien, el GPT-4 es el futuro sin lugar a dudas, ha sido lanzado el presente año 2023 y el mismo se basó en los avances revolucionarios de GPT-3. Pero si hay algo muy importante que decir al respecto, es que aunque los detalles exactos de su arquitectura y los datos de capacitación todavía no se han hecho públicos, hasta donde se conoce, GPT-4 abordó algunas de las deficiencias de GPT-3 e incluso, vendrá con novedosas funciones.

 

Según se ha podido conocer, una de las características determinantes del novedoso y más reciente modelo de OpenAI (GPT-4), es su capacidad para trabajar en múltiples modos, lo que le permite tratar una imagen como un mensaje de texto. Es de aclarar que esta capacidad multimodal abre nuevas posibilidades para las aplicaciones de NLP, desapareciendo las líneas entre el procesamiento de texto e imagen.

 

 

El enfoque de OpenAI de desarrollar múltiples variantes de los modelos GPT, consigue permitir  un conjunto diverso de aplicaciones, algunos buenos, otros no tanto y, también, hay algunos aterradores y hasta confusos. Cada uno de estos modelos, cuenta con sus propias fortalezas y debilidades e incluso, estructuras de costos, para que los usuarios tengan la oportunidad de poder elegir el que mejor se adapte a lo que requiere.

Deja un comentario