fbpx

Microsoft presenta un modelo de aprendizaje de IA que aprende como los humanos

Investigadores han revelado una estrategia pionera, “aprender de los errores” (LeMa), que entrena a la IA para corregir sus propios errores.

Investigadores de Microsoft Research Asia, así como de la Universidad de Pekín y la Universidad Xi’an Jiaotong han desarrollado una nueva técnica para mejorar la capacidad de los modelos de lenguaje grandes (LLM) para resolver problemas matemáticos haciéndoles aprender de sus errores, de forma muy parecida a cómo aprenden los humanos.

 

Para ser más precisos, los investigadores han revelado una estrategia pionera, “aprender de los errores” (LeMa), que entrena a la Inteligencia Artificial (IA) para corregir sus propios errores, lo que lleva a mejores capacidades de razonamiento, según un artículo de investigación publicado esta semana. ¡Todos los detalles aquí en TECHcetera!

 

Aprender de los errores (LeMa)

Es de resaltar que los investigadores se inspiraron en los procesos de aprendizaje humanos, donde un estudiante aprende de sus errores para optimizar su desempeño futuro.

 

Los autores explicaron, “Consideremos a un estudiante humano que no logró resolver un problema de matemáticas; aprenderá del error que cometió y cómo corregirlo”. 

 

Posteriormente, aplicaron este concepto a los LLM, usando pares de datos de corrección de errores generados por GPT-4 para ajustarlos.

 

¿Cómo logra funcionar LeMa para mejorar el razonamiento matemático?

 

Según se conoce, los investigadores primero hicieron que modelos como “LLaMA-2” generaran rutas de razonamiento defectuosas para problemas matemáticos escritos. Posteriormente, GPT-4 identificó errores en el razonamiento, los explicó y suministró rutas de razonamiento corregidas. Los investigadores usaron los datos corregidos para entrenar todavía más los modelos originales.

 

Cabe destacar que los resultados de este nuevo enfoque son significativos. Según han explicado los investigadores “En cinco LLM principales y dos tareas de razonamiento matemático, LeMa mejora constantemente el rendimiento en comparación con el ajuste fino de los datos de CoT únicamente”. 

 

LeMa y sus resultados impresionantes en conjuntos de datos desafiantes

 

Incluso, los LLM especializados como WizardMath y MetaMath también se beneficiaron de LeMa, logrando una precisión de paso @ 1 del 85,4% en GSM8K y un 27,1% en MATH. Estos resultados superan el rendimiento de última generación logrado por modelos de código abierto que no son de ejecución en estas desafiantes tareas.

 

Este avance logra significar más que una simple mejora en la capacidad de razonamiento de los modelos de Inteligencia Artificial (IA). Además, marca un paso significativo hacia sistemas de IA que tengan la capacidad de poder aprender y mejorar de sus errores, al igual que lo hacen los humanos.

 

Extensas implicaciones y direcciones futuras

 

No se debe pasar por alto que la investigación del equipo, incluido su código, datos y así mismo, modelos, ahora se encuentra disponible públicamente en GitHub. Este enfoque de código abierto consigue alentar a la comunidad de Inteligencia Artificial en general a continuar con esta línea de exploración, lo que podría llevar a mayores avances en el aprendizaje automático.

 

Lo cierto es que la llegada de “LeMa” representa un hito importante en la IA, lo que sugiere que los procesos de aprendizaje de las máquinas (ML) tienen la capacidad de poder parecerse más al aprendizaje humano. Este desarrollo podría revolucionar sectores que dependen en gran medida de la IA, como la atención médica, las finanzas y así mismo, los vehículos autónomos, donde la corrección de errores y el aprendizaje continuo son verdaderamente esenciales.

 

Conforme el campo de la Inteligencia Artificial continúa evolucionando rápidamente, la integración de procesos de aprendizaje similares a los humanos, como aprender de los errores, parece ser un factor fundamental para desarrollar sistemas de IA más eficientes y eficaces.

 

Este avance en el aprendizaje automático recalca el apasionante potencial que tenemos por delante en el ámbito de la IA. A medida que las máquinas se vuelven más expertas en aprender de sus errores, nos acercamos a un futuro en el que la Inteligencia Artificial tendrá la posibilidad de poder  superar las capacidades humanas en tareas complejas de resolución de problemas.

 

Deja un comentario