fbpx

Prepárese para la llegada de Operator de OpenAI

Se le puede pedir a Operator que se encargue de una amplia variedad de tareas como; completar formularios, pedir alimentos e incluso crear memes.

Recientemente lanzaron Operator⁠, un agente que puede acceder a la web para realizar tareas por usted (como bien lo dijimos hace un par de días desde TECHcetera). Con su propio navegador, puede ver una página web e interactuar con ella escribiendo, haciendo clic y desplazándose. Hoy por hoy es una versión preliminar de investigación, lo que significa que tiene limitaciones y evolucionará en función de los comentarios de los usuarios. Operator es uno de los  primeros agentes de OpenAI, que son IA capaces de hacer el trabajo por usted de forma independiente: le da una tarea y la ejecuta.

Vale la pena destacar que se le puede pedir a Operator que se encargue de una amplia variedad de tareas repetitivas del navegador, como;  completar formularios, pedir alimentos e incluso crear memes. La capacidad de usar las mismas interfaces y herramientas con las que interactúan los humanos a diario amplía la utilidad de la Inteligencia Artificial, lo que ayuda a las personas a ahorrar tiempo en las tareas cotidianas y, al mismo tiempo, abre nuevas oportunidades de interacción para las empresas.

Todos los detalles que tiene que conocer de Operator de OpenAI

Ahora bien, es crucial señalar que para poder garantizar una implementación segura e iterativa, la compañía está empezando de a poco. Desde ya Operator está disponible para los usuarios Pro en los EE. UU. en; operator.chatgpt.com⁠. Esta vista previa de la investigación le permite a la compañía aprender de los  usuarios y del ecosistema más amplio, y refinar y mejorar a medida que avanzan. El plan de la empresa, según han informado, es expandirse a los usuarios de Plus, Team y Enterprise e integrar estas capacidades en ChatGPT en el futuro.

¿Cómo funciona Operator?

Cómo funciona Operator es algo sin duda fundamental que debe conocer. El mismo funciona con un nuevo modelo llamado “Computer-Using Agent” (CUA). Al combinar las capacidades de visión de GPT-4o con razonamiento avanzado a través del aprendizaje de refuerzo, CUA se encuentra capacitado para interactuar con interfaces gráficas de usuario (GUI), los botones, menús y así mismo, campos de texto que las personas ven en una pantalla.

El novedoso “Operator” tiene la capacidad de poder “ver” (a través de capturas de pantalla) e “interactuar” (utilizando todas las acciones que permiten un mouse y un teclado) con un navegador, lo que le permite llevar a cabo acciones en la web sin necesidad de integraciones API personalizadas.

Debe saber que si encuentra desafíos o comete errores, Operator puede aprovechar sus capacidades de razonamiento para autocorregirse. Cuando se bloquea y necesita ayuda, simplemente devuelve el control al usuario, lo que garantiza una experiencia fluida y al mismo tiempo, colaborativa.

Aunque CUA todavía se encuentra en etapas iniciales y tiene limitaciones, establece nuevos resultados de referencia de vanguardia en WebArena y WebVoyager, 2 puntos de referencia clave para el uso de navegadores.

¿Cómo se puede utilizar?

Tiene que saber que para comenzar, simplemente debe describir la tarea que desea que se realice y Operator se encargará del resto. Los usuarios tienen la capacidad de elegir tomar el control del navegador remoto en cualquier momento, y Operator está capacitado para solicitarle de manera proactiva que se haga cargo de las tareas que requieren inicio de sesión, detalles de pago o al resolver CAPTCHA.

De igual manera, los usuarios pueden personalizar sus flujos de trabajo en Operator añadiendo instrucciones personalizadas, ya sea para todos los sitios o para sitios específicos, como configurar preferencias para aerolíneas en Booking.com. Operator permite a los usuarios guardar avisos para un acceso rápido en la página de inicio, ideal para tareas repetidas como reponer alimentos en Instacart. De manera similar al uso de múltiples pestañas en un navegador, los usuarios tienen la posibilidad de hacer que Operator ejecute múltiples tareas simultáneamente creando nuevas conversaciones, como pedir una taza de esmalte personalizada en Etsy mientras reserva un campamento en Hipcamp.

Ecosistema y usuarios

Operator⁠ logra transformar la IA de una herramienta pasiva a un participante activo en el ecosistema digital. Agilizará las tareas de los usuarios y acercará los beneficios de los agentes a las empresas que desean experiencias innovadoras para los clientes y desean mayores tasas de conversión. Desde la compañía, han dado a conocer que se encuentran colaborando con empresas como DoorDash, Instacart, OpenTable, así como con; Priceline, StubHub, Thumbtack, Uber y otras para garantizar que Operator aborde las necesidades del mundo real respetando las normas establecidas. Ahora bien, además de estas colaboraciones, la compañía ve mucho potencial para mejorar la accesibilidad y la eficiencia de ciertos flujos de trabajo, particularmente en aplicaciones del sector público.

Seguridad y privacidad

Garantizar que Operator sea seguro de usar es una prioridad máxima, con 3 capas de protección para evitar el abuso y garantizar que los usuarios tengan el control total.

Primero que nada, Operator se encuentra capacitado para garantizar que la persona que lo usa siempre tenga el control y solicita información en puntos críticos.

  • Modo de toma de control: Operator de OpenAI le pide al usuario que tome el control cuando ingresa información confidencial en el navegador, como credenciales de inicio de sesión o información de pago. Cuando está en modo de toma de control, Operator no recopila ni captura la información ingresada por el usuario.
  • Confirmaciones de usuario: es inherente mencionar que antes de finalizar cualquier acción importante, como enviar un pedido o un correo electrónico, Operator debe solicitar aprobación.
  • Limitaciones de tareas: Operator está capacitado para rechazar ciertas tareas sensibles, como transacciones bancarias o aquellas que requieren decisiones de alto riesgo, como tomar una decisión sobre una solicitud de empleo.
  • Modo de vigilancia: en sitios fundamentalmente sensibles, como correo electrónico o servicios financieros, Operator de OpenAI requiere una supervisión cercana de sus acciones, lo que permite a los usuarios detectar directamente cualquier error potencial.

Seguidamente, han facilitado la gestión de la privacidad de los datos en Operator.

  • Exclusión voluntaria del entrenamiento: debe saber que al desactivar “Mejorar el modelo para todos” en la configuración de ChatGPT, los datos en Operator tampoco se utilizarán para entrenar los modelos.
  • Gestión transparente de datos: los usuarios tienen la capacidad de poder eliminar todos los datos de navegación y cerrar sesión en todos los sitios con un solo clic en la sección Privacidad de la configuración de Operator. Las conversaciones pasadas en Operator también se pueden eliminar con un solo clic.

Por último y no menos importante, han creado defensas contra sitios web adversarios que pueden intentar engañar a Operator a través de mensajes ocultos, código malicioso o inclusive, intentos de phishing:

  • Navegación cautelosa: Operator se encuentra diseñado para detectar e ignorar las inyecciones de mensajes.
  • Monitoreo: un “modelo de monitoreo” dedicado observa el comportamiento sospechoso y puede pausar la tarea si algo parece extraño.
  • Canal de detección: los procesos de revisión automatizados y humanos identifican de forma continua nuevas amenazas y actualizan rápidamente las protecciones.

Desde OpenAI saben que los actores maliciosos pueden intentar hacer un mal uso de esta tecnología. Es por tal motivo que, han diseñado Operator para rechazar solicitudes dañinas y bloquear contenido no permitido. Los sistemas de moderación pueden emitir advertencias o incluso revocar el acceso por infracciones reiteradas, y así mismo, han integrado procesos de revisión adicionales para detectar y abordar el mal uso. Del mismo modo, proporcionan orientación sobre cómo interactuar con Operator de conformidad con sus Políticas de uso.

Aunque Operator está diseñado con estas protecciones, ningún sistema es perfecto y esto todavía es una vista previa de investigación; la empresa se encuentra comprometida con la mejora continua a través de comentarios del mundo real y pruebas rigurosas.

Deja un comentario