Gemini viene siendo un nuevo y potente modelo de Inteligencia Artificial (IA) de Google que, tiene la capacidad de poder comprender no sólo texto sino también imágenes, vídeos y así mismo, audio. Es de aclarar que como modelo multimodal, se describe como capaz de completar tareas complejas en matemáticas, así como en física y otras áreas, además de comprender y generar código de alta calidad en diversidad de lenguajes de programación.
Conozca Gemini el nuevo modelo de IA de Google
Según se informa, actualmente está disponible a través de integraciones con Google Bard y Google Pixel 8 y progresivamente se incorporará a otros servicios de Google.
Dennis Hassabis, director ejecutivo y cofundador de Google DeepMind ha indicado, “Gemini es el resultado de esfuerzos de colaboración a gran escala por parte de equipos de Google, incluidos nuestros colegas de Google Research. Fue construido desde cero para ser multimodal, lo que significa que puede generalizar y comprender, operar y combinar sin problemas diferentes tipos de información, incluidos texto, código, audio, imagen y video”.
Ahora bien, es necesario que sepa que fue creado por Google y Alphabet, la empresa matriz de Google, y lanzado como el modelo de Inteligencia Artificial (IA) más avanzado de la empresa hasta el momento. Incluso, vale la pena resaltar que Google DeepMind también hizo importantes contribuciones al desarrollo de Gemini.
Demo de Gemini (no es en tiempo real y parece tener edición)
¿Existen diferentes versiones de Gemini?
Google lo describe como un modelo flexible que es capaz de ejecutarse en todo, desde los centros de datos de Google hasta incluso dispositivos móviles. Según se pudo conocer, para poder lograr esta escalabilidad, se lanza en 3 tamaños los cuales son: Nano, Pro y Ultra que a continuación, comentaremos un poco sobre ellos.
- Gemini Nano: Es necesario dejar claro que el tamaño del modelo Gemini Nano se encuentra diseñado para ejecutarse en teléfonos inteligentes, concretamente Google Pixel 8. Según se informa, está diseñado para ejecutar tareas en el dispositivo que requieren un procesamiento eficiente de Inteligencia Artificial sin conectarse a servidores externos, como sugerir respuestas dentro de aplicaciones de chat o resumir texto por ejemplo.
- Gemini Pro: En el caso de Gemini Pro hay que señalar que se ejecuta en los centros de datos de Google, se encuentra diseñado para impulsar la última versión del chatbot de IA de la compañía, Bard. Es capaz de proporcionar tiempos de respuesta rápidos y así mismo, comprender consultas complejas.
- Gemini Ultra: Hay que dejar claro que aunque todavía no está disponible para un uso generalizado, Google describe a Gemini Ultra como su modelo más capaz, superando los “resultados actuales de última generación en 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación de modelos de lenguaje grande y desarrollo”. Según se pudo conocer, se encuentra diseñado para tareas altamente complejas y se lanzará después de finalizar su fase actual de prueba.
Esto es lo que debe saber si quiere acceder
Cabe acotar que ahora está disponible en los productos de Google en sus tamaños Nano y Pro, como el teléfono Pixel 8 y el chatbot Bard, respectivamente. Desde Google planean integrar Gemini con el tiempo en su Búsqueda, así como también en Anuncios, Chrome y otros servicios.
Debe saber que los desarrolladores y clientes empresariales podrán acceder a Gemini Pro a través de la API de Gemini en AI Studio de Google y Google Cloud Vertex AI a partir del día 13 de diciembre. Es vital mencionar que los desarrolladores de Android tendrán acceso a Gemini Nano a través de AICore, que estará disponible en una versión preliminar.
Cabe hacerse la pregunta; ¿en qué se diferencia Gemini de otros modelos de Inteligencia Artificial, como GPT-4? Para responder a ello, debemos señalar que el nuevo modelo Gemini de Google parece ser uno de los modelos de IA más grandes y avanzados hasta el momento, aunque el lanzamiento del modelo Ultra será el que lo determine con certeza. En comparación con otros modelos populares que impulsan los chatbots de IA en este momento, Gemini se destaca por su característica multimodal nativa, mientras que otros modelos, como GPT-4, dependen de complementos e integraciones para ser realmente multimodales.
Esperamos que haya podido aclarar su duda con respecto a este nuevo modelo de IA de Google y que vuelva pronto por más datos interesantes para que siga enriqueciendo sus conocimientos.