OpenAI ya tiene toda la información que requiere para entrenar su próximo modelo de IA

Recientemente, en una entrevista Sam Altman, director ejecutivo de OpenAI, destacó la importancia de datos de alta calidad para entrenar modelos de Inteligencia Artificial (IA). Altman señaló que la compañía actualmente tiene suficientes datos para la próxima versión después de GPT-4.

La compañía ya tiene toda la información que necesita para entrenar su próximo modelo de IA

En una entrevista en la Cumbre Mundial AI for Good, Altman comentó la necesidad de datos de alta calidad en los sistemas de IA, bien sea que provengan de humanos o se generen sintéticamente. La posibilidad de que demasiados datos generados por Inteligencia Artificial tengan la capacidad de dañar un sistema de IA no parece preocupar a Altman per se. Así mismo, mencionó que los datos de baja calidad de cualquiera de las fuentes son un problema.

“Creo que lo que se necesita son datos de alta calidad. Hay datos sintéticos de baja calidad y datos humanos de baja calidad”, expresó Altman en una entrevista en la Cumbre Global AI for Good.

Lo cierto es que, por el momento, OpenAI cuenta con suficientes datos para entrenar el próximo modelo después de GPT-4, señaló Altman.

Ahora bien, el director ejecutivo de OpenAI también dijo que la empresa ha estado probando la generación de grandes cantidades de datos sintéticos para examinar diferentes maneras de entrenar la Inteligencia Artificial.

Sin embargo, la pregunta principal es ¿cómo los sistemas de Inteligencia Artificial (IA) tienen la capacidad de poder aprender más con menos datos, en vez de simplemente generar cantidades masivas de datos sintéticos para entrenamiento? Altman ha señalado que sería “muy extraño” si la mejor forma de entrenar un modelo fuera “generar como un billón de tokens de datos sintéticos y volver a alimentarlos”.

Es de resaltar que para Altman, la capacidad de aprender eficientemente a partir de los datos es realmente clave y describe la pregunta central cómo “¿cómo se aprende más con menos datos?”. Ha advertido que OpenAI y así mismo, otras empresas todavía requieren descubrir qué datos y métodos funcionan mejor para entrenar sistemas de IA cada vez más potentes.

Hay que destacar que la ciencia respalda los comentarios de Altman al mostrar que mejores datos transportan a un mejor rendimiento de la Inteligencia Artificial. También encaja con la estrategia de OpenAI de gastar cientos de millones recientemente para licenciar datos de capacitación de los principales editores.

What are You Looking for?

OpenAI ya tiene toda la información que requiere para entrenar su próximo modelo de IA

La compañía ya tiene toda la información que necesita para entrenar su próximo modelo de IA

Read Next

Los chatbots son el pasado. El impacto de la IA en la robótica será 1000x más grande

¿Le gusta el nuevo look de Netflix?

WWDC 2024: hablemos de privacidad

Hablemos de Apple Intelligence

Deja un comentarioCancelar respuesta