Para nadie es un secreto que los modelos básicos han transformado la Inteligencia Artificial (IA) en el mundo digital. Los modelos de lenguajes grandes (LLM) como por ejemplo; ChatGPT y Bard, revolucionaron la IA para el lenguaje. Es vital mencionar que aunque los modelos GPT de OpenAI no son el único modelo de lenguaje grande disponible, han logrado el reconocimiento más integral por recibir entradas de texto e imágenes y también por brindar respuestas similares a las humanas, incluso con algunas tareas que demandan resolución de problemas complejos y razonamiento avanzado.
La acogida viral y generalizado de ChatGPT de OpenAI ha dado forma en gran medida a cómo la sociedad entiende este nuevo momento para la Inteligencia Artificial. Además de esto, hay que acotar que el próximo avance que definirá la IA durante generaciones es la robótica. La construcción de robots impulsados por Inteligencia Artificial que puedan aprender a interactuar con el mundo físico optimizará todas las formas de trabajo repetitivo en sectores que van desde la logística y el transporte hasta incluso, la manufactura, el comercio minorista, la agricultura y la atención médica. Así mismo, liberará tantas eficiencias en el mundo físico como las que hemos podido observar en el mundo digital durante los últimos años. No deje de conocer todo acerca de este tema tan interesante y enriquezca sus conocimientos en el área.
Esto es lo que debe conocer sobre la robótica y la IA
Es importante señalar que algunas de las mentes más brillantes en Inteligencia Artificial han logrado avances significativos en la construcción del “GPT para la robótica”.
La misma tecnología central que permite a GPT observar, pensar e, incluso hablar, también consigue permitir a las máquinas observar, “pensar” y actuar. Los robots impulsados por un modelo básico tienen la capacidad de poder comprender su entorno físico, así como tomar decisiones informadas y adaptar sus acciones a circunstancias cambiantes.
El denominado “GPT para la robótica” se está construyendo de la misma manera que el GPT: sentando las bases para una revolución que, una vez más, redefinirá la IA tal como la conocemos.
Es de aclarar que al adoptar un enfoque de modelo básico, se puede crear una Inteligencia Artificial que funcione en múltiples tareas en el mundo físico. Hace algunos años, los expertos aconsejaron crear una IA especializada para robots que recogen y empaquetan alimentos. Y eso es diferente de un modelo que tiene la capacidad de poder clasificar varias piezas eléctricas, que también es diferente del modelo que descarga paletas de un camión por ejemplo.
Este cambio de paradigma hacia un modelo básico permite que la Inteligencia Artificial (IA) responda mejor a escenarios extremos que comúnmente existen en entornos no estructurados del mundo real y que, de otro modo, pudieran confundir modelos con un entrenamiento más limitado. Por lo que, construir una IA generalizada para todos estos escenarios es mucho más exitoso. Es entrenando en todo lo que se obtiene la autonomía a nivel humano que nos faltaba en las generaciones anteriores de robots.
Enseñar a un robot a aprender qué acciones llevan al éxito y cuáles llevan al fracaso es considerablemente difícil. Solicita datos extensos de alta calidad basados en interacciones físicas del mundo real. Los entornos de laboratorio individuales o incluso, los ejemplos de video son fuentes poco confiables o lo suficientemente sólidas (por ejemplo, los videos de YouTube no logran traducir los detalles de la interacción física y los conjuntos de datos académicos tienden a tener un alcance limitado).
A diferencia de la IA para el procesamiento del lenguaje o de imágenes, ningún conjunto de datos preexistente representa cómo deberían interactuar los robots con el mundo físico. Por lo tanto, un conjunto de datos grande y así mismo, de alta calidad se convierte en un desafío más complejo de resolver en robótica, y desplegar una flota de robots en producción es la única forma de construir un conjunto de datos diverso.
Ahora bien, de forma similar a responder preguntas de texto con capacidad de nivel humano, el control y la manipulación robóticos requieren que un agente busque el progreso hacia una meta que no tiene una respuesta única y correcta (por ejemplo, “¿Cuál es una manera exitosa de recoger esta cebolla roja?”). Una vez más, se requiere algo más que puramente aprendizaje supervisado.
Necesita un robot que ejecute aprendizaje por refuerzo profundo (RL profundo) para tener éxito en la robótica. Este enfoque autónomo de autoaprendizaje consigue combinar la realidad virtual con redes neuronales profundas para desbloquear niveles más altos de rendimiento; la Inteligencia Artificial (IA) adaptará automáticamente sus estrategias de aprendizaje y continuará afinando sus habilidades a medida que experimente nuevos escenarios.
Expertos sentaron las bases técnicas y comerciales
En los últimos años, algunos de los expertos en Inteligencia Artificial (IA) y robótica más brillantes del mundo, sentaron las bases técnicas y comerciales para una revolución del modelo de base robótica que redefinirá el futuro de la IA.
Aunque estos modelos de IA se han construido de forma similar a GPT, lograr una autonomía a nivel humano en el mundo físico es un desafío científico diferente por 2 motivos:
- La creación de un producto basado en Inteligencia Artificial que pueda servir en una variedad de entornos del mundo real tiene un conjunto notable de requisitos físicos complejos. La IA debe adaptarse a diferentes aplicaciones de hardware, debido a que es dudoso que un hardware funcione en diversas industrias (logística, transporte, manufactura, comercio minorista, agricultura, entre otras) y actividades dentro de cada sector.
- Los almacenes y centros de distribución son un entorno de aprendizaje ideal para los modelos de IA en el mundo físico. Es habitual tener cientos de miles o incluso millones de unidades de almacenamiento (SKU) diferentes fluyendo mediante cualquier instalación en un momento dado, entregando el conjunto de datos grande, patentado y de alta calidad necesario para entrenar el “GPT para robótica”.
Lo cierto es que el “momento GPT” de la robótica IA está cerca, la trayectoria de crecimiento de los modelos de bases robóticas se está acelerando a un ritmo muy vertiginoso. Las aplicaciones robóticas, especialmente en tareas que solicitan manipulación precisa de objetos, ya se están aplicando en entornos de producción del mundo real y, muy seguramente, veremos un número exponencial de aplicaciones robóticas comercialmente factibles implementadas a escala en 2024.