Del razonamiento humano al robótico

Imagina comprar un robot para realizar tareas domésticas ¡sería realmente increíble! un robot fue construido y entrenado en una fábrica en un determinado conjunto de tareas, cuando se le pide que recoja una taza de la mesa de su cocina por ejemplo, es posible que no la reconozca (probablemente porque tenga una imagen inusual) y entonces, el robot falle. Por tal motivo, Peng y sus colaboradores del MIT, la Universidad de Nueva York y la Universidad de California en Berkeley, consiguieron crear un marco que permite a los humanos poder enseñar rápidamente a un robot lo que quieren que haga, con un esfuerzo bastante mínimo. A continuación, le presentaremos los mejores detalles de cómo pasar del razonamiento humano al robótico

aspiradora electrónica — Robot aspiradora de Los Supersónicos.

Una manera más rápida de enseñar pasando del razonamiento humano al robótico

Se debe tener presente que cuando un robot falla, el sistema hace uso de un algoritmo para poder generar explicaciones contrafactuales que describen lo que se precisa cambiar para que el robot pueda llegar a tener éxito. Ahora bien, este marco podría ayudar a los robots a aprender más rápido en nuevos entornos sin necesitar que el usuario tenga conocimientos técnicos. En un futuro, esto podría ser un paso para permitir que los robots de uso general realicen de forma eficiente las tareas diarias para personas mayores o incluso, para personas con discapacidades en una variedad de entornos.

En el trabajo de formación

Se debe mencionar que por lo general, los robots fallan debido al cambio de distribución: al robot se le presentan objetos y, así mismo, espacios que no vio durante el entrenamiento y no logra entender qué hacer en este nuevo ambiente. Por lo que se debe decir que una manera de poder volver a entrenar a un robot para una tarea concreta es el aprendizaje por imitación. El usuario tendría la capacidad de poder demostrar la tarea correcta para enseñarle al robot qué hacer. Si un determinado usuario intenta enseñarle a un robot a levantar una taza por ejemplo pero, lo manifiesta con una taza color blanco, el robot podría llegar a aprender que todas las tazas son blancas. Entonces puede llegar a fallar al recoger una taza roja, azul u otra.

Por lo que Peng ha señalado que no desea tener que manifestarse con 30.000 tazas. Tan sólo desea poder demostrar con una sola taza. Pero posteriormente, indicó que debe enseñarle al robot para que reconozca que puede recoger una taza de cualquier color.

Por lo tanto, se debe conocer que para poder lograr esto, el sistema de los investigadores determina qué objeto específico le importa al usuario (una taza, por ejemplo) y así mismo, qué elementos no son importantes para la tarea (posiblemente el color de la taza no importa). Hace uso de esta información para poder generar nuevos datos sintéticos al cambiar estos conceptos visuales “sin importancia”, este proceso se le conoce como “aumento de datos”.

El marco dispone de 3 pasos

El marco posee 3 pasos los cuales son: primero, deja en evidencia la tarea que provocó la falla del robot. Luego recopila una demostración del usuario de las acciones deseadas o anheladas y genera contrafactuales mediante la búsqueda de todas las características en el espacio que muestran lo que se necesita cambiar para que el robot pueda tener éxito. Ahora bien, el sistema muestra estos contrafactuales al usuario y, así mismo, pide retroalimentación para poder establecer qué conceptos visuales no impactan en la acción deseada. Posteriormente, consigue hacer uso de esta retroalimentación humana para poder generar muchas nuevas demostraciones aumentadas.

Lo que quiere decir que de esta manera, el usuario podría mostrar que levanta una taza, pero el sistema produciría demostraciones mostrando la acción deseada con diversidad de tazas diferentes alterando el color. Usa estos datos para ajustar el robot. Según ha mencionado Peng, la creación de explicaciones contrafactuales y, así mismo, la solicitud de comentarios del usuario son realmente fundamentales para que la técnica pueda llegar a tener éxito.

Del razonamiento humano al razonamiento robótico

Producto de que su trabajo busca colocar al humano en el circuito de entrenamiento, los investigadores tuvieron la oportunidad de probar su técnica con usuarios humanos. Primeramente, pudieron efectuar un estudio en el que preguntaron a las personas si las explicaciones contrafactuales les lograron ayudar a poder identificar elementos que podrían cambiarse sin afectar o perturbar la tarea.

Según ha mencionado Peng, los humanos son muy buenos en este tipo de razonamiento contrafáctico. Y así mismo, señaló que este paso contrafáctico es lo que consigue poder permitir que el razonamiento humano se vuelva en razonamiento robótico de una forma en la que tenga sentido.

Posteriormente, los investigadores procedieron a aplicar su marco a 3 simulaciones en las que los robots tenían la tarea de: navegar hacia un objeto objetivo, también recoger una llave y así mismo, abrir una puerta e incluso, recoger un objeto anhelado para luego colocarlo sobre una mesa. Cabe aclarar que en cada caso, su método consiguió que el robot aprendiera de manera más rápida que con otras técnicas, al mismo tiempo que demandaba menos demostraciones por parte de los usuarios.

En el futuro, los investigadores esperan poder probar este marco en robots reales, e incluso, desean poder centrarse en disminuir el tiempo que tarda el sistema en crear nuevos datos utilizando modelos generativos de aprendizaje automático. Según ha explicado Peng, al final lo que se quiere es permitir que un robot aprenda una adecuada representación parecida a la humana en un nivel abstracto.

What are You Looking for?

Del razonamiento humano al robótico

Una manera más rápida de enseñar pasando del razonamiento humano al robótico

En el trabajo de formación

El marco dispone de 3 pasos

Del razonamiento humano al razonamiento robótico

Read Next

Novedades de WhatsApp

Lo que no sabe del Z Fold 5 y el Z Flip 5

Algunas inversiones de EEUU en China van a tener restricciones!

Hablemos sobre computación confidencial

Deja un comentarioCancelar respuesta