Google ha presentado oficialmente su formidable respuesta a ChatGPT: Gemini. Este flamante modelo de lenguaje (LLM) de Google está disponible para su evaluación y se proyecta como la inteligencia artificial más sofisticada hasta ahora. Contrariamente a las expectativas, Google ha optado por lanzar de inmediato su novedoso modelo de IA en tres variantes distintas: nano, Pro y Ultra. La única desventaja es que la versión más potente, Gemini Ultra, no estará disponible hasta los primeros compases del próximo año.
1La nueva IA de Google salió a la luz y promete ser mejor que ChatGPT-4
Gemini, un modelo de inteligencia artificial que destaca sobre todos sus competidores en las pruebas más destacadas. Este modelo es multimodal, lo que implica que tiene la capacidad de comprender información proveniente de diversas fuentes, abarcando desde texto hasta imágenes, pasando por vídeos, audio o código. Según las explicaciones proporcionadas por Google, Gemini representa su «modelo más versátil hasta la fecha».
De acuerdo con Google, los resultados obtenidos por Gemini Ultra son los más destacados en 30 de las 32 pruebas académicas de uso general, superando ligeramente los porcentajes alcanzados por GPT-4, el modelo desarrollado por OpenAI. Google detalla que, con una impresionante puntuación del 90,04% en MMLU (comprensión masiva del lenguaje multitarea), este modelo se convierte en el primero en superar a los expertos humanos en una evaluación que abarca 57 disciplinas, tales como física, historia, medicina, ética, además de la capacidad para resolver problemas.
Una forma de abordar los desafíos de manera única. Google ha concebido Gemini desde cero, adoptando un enfoque totalmente diferente para resolver problemas. Este modelo es intrínsecamente multimodal, lo que implica que está preentrenado desde el inicio para fusionar diversas modalidades. En un video de demostración, se ilustra cómo Gemini tiene la capacidad de interpretar en tiempo real dibujos, establecer relaciones entre objetos y sugerir canciones mientras recibimos indicaciones.
Google destaca que Gemini es «excepcionalmente hábil para extraer conocimientos difíciles de identificar entre grandes cantidades de datos». Con AlphaCode 2, Gemini introduce un innovador sistema de generación de código denominado AlphaCode2. Según la descripción de Google, este nuevo sistema sobresale en matemáticas complejas y en la comprensión teórica de la ciencia de la computación. Según los datos, AlphaCode 2 supera al rendimiento del 85% de los participantes, mientras que, para referencia, AlphaCode 1 superaba al 50%.
Un avance notable en términos de eficiencia. Aunque Google no ha compartido oficialmente la cantidad exacta de parámetros, destaca que Gemini Ultra representa el modelo más eficiente desarrollado hasta la fecha, lo que significa que ofrece un rendimiento superior con un consumo de energía significativamente reducido.
Este incremento en eficiencia se atribuye en parte a la introducción de Gemini Ultra junto al sistema TPU v5p, la unidad de procesamiento tensorial más potente, eficiente y escalable hasta el momento. Además de emplear TPUs, Gemini ha sido entrenado y utiliza GPUs externas, presumiblemente las populares Nvidia H100. Gemini ya está siendo implementado en Google Bard en distintas fases. A partir de hoy, Google Bard experimenta su actualización más significativa con la transición a Gemini Pro. El chatbot de Google comenzará a utilizar la versión intermedia de Gemini, la cual estará disponible en inglés en más de 180 países y se desplegará en Europa en los próximos meses.
A partir del próximo año, Google tiene previsto lanzar Bard Advanced, una versión mejorada de su inteligencia artificial que incorporará Gemini Ultra. Hasta el momento, la versión más avanzada de Gemini no ha sido lanzada oficialmente, ya que, según Google, se están llevando a cabo exhaustivas verificaciones de confianza y seguridad. Esta implementación también se extenderá al Google Pixel 8 Pro. Además de su presencia en Bard, Gemini estará disponible en diversos servicios, como el motor de búsqueda, Ads, Chrome y Duet AI. A partir del 13 de diciembre, los desarrolladores tendrán acceso a Gemini Pro a través de la API en Google AI Studio o Vertex AI.
Gemini también se integrará en los dispositivos Google Pixel 8 Pro. AICore, un nuevo servicio, ofrecerá a los creadores de aplicaciones la oportunidad de aprovechar las capacidades de la inteligencia artificial, en este caso, con Gemini Nano, su versión más liviana.
Google señala que, según sus planes, esta posibilidad también se extenderá en el futuro a otros dispositivos que utilicen Android 14, aunque no se han proporcionado detalles adicionales al respecto.
Google aspira a retomar un papel destacado en el ámbito de la inteligencia artificial. Más allá de sus capacidades funcionales, Gemini se presenta como el modelo de inteligencia artificial sometido a las evaluaciones de seguridad más exhaustivas. Por este motivo, los representantes de Google destacan que, en su búsqueda por identificar posibles vulnerabilidades, han colaborado estrechamente con expertos externos. Simultáneamente, han implementado clasificadores de seguridad específicos para detectar contenidos que pudieran involucrar violencia o perpetuar estereotipos negativos.
Sundar Pichai, CEO de Google, comenta: «Estamos ante el inicio de una nueva era para nosotros». Aunque la espera por Gemini ha sido prolongada, finalmente ha llegado, y el próximo año se anticipa la llegada de GPT-5. Estos avances marcan un hito en un campo tan dinámico como el de la inteligencia artificial, donde cada mes parece traer consigo novedades significativas.