fbpx

Así funcionan los AI Agents de ElevenLabs

AI Agents de ElevenLabs así es como funcionan.

ElevenLabs lanzó el pasado lunes la capacidad de crear bots de IA conversacionales. La compañía anunció que los usuarios ahora tienen la capacidad de poder construir agentes conversacionales completos en la plataforma para desarrolladores de ElevenLabs, con variables personalizables como el tono de voz y la duración de la respuesta. ¡Así funcionan los AI Agents de ElevenLabs!

AI Agents de ElevenLabs así es como funcionan

Por si no lo sabía, desde TECHcetera le comentamos que ElevenLabs se ha dedicado principalmente a proporcionar distintas voces y herramientas de Inteligencia Artificial para servicios de conversión de texto a voz. El responsable de crecimiento de la compañía, Sam Sklar, comentó al medio de noticias, TechCrunch, que muchos de sus clientes ya estaban usando esta capacidad para crear agentes de IA conversacionales. Sin embargo, las partes más difíciles fueron la integración de la base de conocimientos y la gestión de las interrupciones de los clientes. Por tal motivo, la compañía decidió crear un canal completo para bots conversacionales.

Los usuarios tienen la posibilidad de iniciar sesión en su cuenta de ElevenLabs y comenzar a crear un agente de conversación seleccionando una plantilla o creando un nuevo proyecto. Pueden escoger el idioma principal del agente, el primer mensaje y así mismo, el mensaje del sistema para determinar la personalidad del agente. Los desarrolladores también tienen que seleccionar un modelo de lenguaje amplio (Gemini, GPT o Claude), la temperatura de las respuestas (para determinar cuán creativa debe ser la respuesta) y del mismo modo, el límite de uso de tokens.

Asimismo pueden ajustar otros aspectos como lo son; la voz, la latencia, la estabilidad, así como los criterios de autenticación y la duración máxima de la conversación con los agentes de IA (AI Agents).

Los usuarios tienen la posibilidad de añadir su propia base de conocimiento, como un archivo, una URL o un bloque de texto, para impulsar el bot conversacional. Además de esto, pueden integrar su propio LLM personalizado con el bot. El SDK de ElevenLabs es compatible con Python, JavaScript, React y Swift. La compañía también proporciona una API WebSocket para una mayor personalización.

Ahora bien, las empresas también pueden definir criterios para recopilar determinados datos (por ejemplo, el nombre y el correo electrónico de los clientes que hablan con el agente) junto con criterios de evaluación en lenguaje natural para definir el éxito o incluso, el fracaso de la llamada.

ElevenLabs se encuentra aprovechando su cartera existente para la parte de texto a voz. La empresa tiene que desarrollar capacidades de voz a texto para el nuevo producto de IA conversacional. La compañía no proporciona su API de voz a texto como un producto independiente por ahora, pero podría hacerlo en el futuro, lo que claramente, la convertiría en un competidor de las API de voz a texto de Google, Microsoft y así mismo Amazon, así como de API especializadas, como Whisper, AssemblyAI, asi como Deepgram, Speechmatics y Gladia de OpenAI.

Compite con una amplia variedad, pero lo cierto es que, en particular, la empresa rivalizará con la API conversacional en tiempo real de OpenAI. Sin embargo, ElevenLabs cree que sus personalizaciones y su capacidad para cambiar de modelo le darán una ventaja sobre OpenAI.

 

Deja un comentario