Según se pudo descubrir, OpenAI se encuentra lanzando una “vista previa de investigación” de un agente de Inteligencia Artificial (agente de IA) denominado Operator “que tiene la capacidad de poder ir a la web para llevar a cabo tareas por usted”, según una publicación de blog. Nuevo agente de IA para operadores de OpenAI puede hacer cosas por usted en la web y esto es lo que debe saber.
OpenAI se encuentra lanzando una “vista previa de investigación” de un agente de IA denominado Operator
“Usando su propio navegador, puede mirar una página web e interactuar con ella escribiendo, haciendo clic y desplazándose”, señala OpenAI.
Vale la pena destacar que se está lanzando primero en los Estados Unidos para los suscriptores del nivel ChatGPT Pro de OpenAI de un valor de 200$ por mes.
Es crucial señalar que el operador se basa en un modelo de “agente que utiliza la computadora” el cual combina las capacidades de visión de GPT-4o con razonamiento avanzado a través del aprendizaje de refuerzo para poder interactuar con las GUI, según comenta OpenAI.
“El operador puede ver (a través de capturas de pantalla) e interactuar (utilizando todas las acciones que permiten un mouse y un teclado) con un navegador, lo que le permite realizar acciones en la web sin necesidad de integraciones API personalizadas”, según OpenAI.
Ahora bien, el operador tiene la capacidad de poder usar el razonamiento para “autocorregirse” y, si se bloquea, le proporcionará el control al usuario. Del mismo modo, le pedirá al usuario que tome el control cuando un sitio web solicite información confidencial, como por ejemplo; credenciales de inicio de sesión y “debería” solicitar que un usuario apruebe acciones como enviar un correo electrónico.
Además de todo esto, OpenAI también ha dado a conocer que Operator ha sido diseñado para “rechazar solicitudes dañinas y bloquear contenido no permitido”.
Entre tanto, OpenAI ha afirmado que se encuentra colaborando con compañías como; DoorDash, Instacart, OpenTable, Priceline, así como con; Stubhub, Thumbtack y Uber para que Operator “aborde las necesidades del mundo real respetando las normas establecidas”.
Sin embargo, si hay algo importante que destacar es que, la compañía advierte de que es posible que no todo funcione como se espera por el momento; la herramienta actualmente posee problemas con “interfaces complejas como la creación de presentaciones de diapositivas o la gestión de calendarios”.
Desde OpenAI afirman que en el futuro planean llevar Operator a los usuarios Plus, así como Team y Enterprise e “integrar estas capacidades en ChatGPT”.