Llama 3.1 405B de Meta compite en rendimiento con los grandes modelos cerrados de IA

En un gran paso para la industria de la inteligencia artificial, Meta ha dado a conocer su más reciente creación, Llama 3.1, un modelo fundacional de código abierto que se equipara a los rivales cerrados más avanzados. Con 405.000 millones de parámetros (405B) y capacidades impresionantes en conocimientos generales, orientación, matemáticas, uso de herramientas y traducción multilingüe, este modelo se posiciona como uno de los más robustos y versatiles del mercado.

La presentación de Llama 3.1 405B marca un hito en el desarrollo de la IA de código abierto, superando incluso a los modelos cerrados más avanzados como GPT-4, GPT-4o y Claude 3.5 Sonnet, según las pruebas realizadas por la compañía. Este modelo fundacional ha sido entrenado con 15 billones de tokens, lo que ha requerido una enorme inversión de recursos, incluyendo el uso de 16.000 GPU H100 de Nvidia.

Llama 3.1: Estableciendo Nuevos Estándares en Inteligencia Artificial

Rendimiento Excepcional: Llama 3.1 405B ha sido diseñado para rivalizar en rendimiento con los modelos cerrados más avanzados del mercado, destacándose en una amplia gama de capacidades. Desde los conocimientos generales hasta la orientación, pasando por las matemáticas, el uso de herramientas y la traducción multilingüe, este modelo ha demostrado su superioridad en escenarios reales.

Arquitectura Optimizada: Debido a la escala del entrenamiento, Meta ha optado por una arquitectura de modelo de transformador de solo decodificador estándar. Este enfoque, junto con un procedimiento iterativo que combina ajuste supervisado y optimización directa de las preferencias, ha permitido a Llama 3.1 405B ofrecer respuestas de alta calidad tanto en contextos más cortos como en los más amplios.

Versiones Mejoradas: Además del lanzamiento de Llama 3.1 405B, Meta también ha presentado versiones mejoradas de los modelos Llama 8B y 70B. Estos modelos de menor escala también ofrecen una ventana de contexto de 128.000 tokens y muestran mejores capacidades de razonamiento, lo que les permite brindar soporte para resúmenes de texto de formato largo, agentes conversacionales multilingües y asistentes de codificación.

Compromiso con una IA Responsable

Desarrollo Responsable: En su compromiso con una IA responsable, Meta ha anunciado la implementación de un sistema de referencia que incluye ejemplos de aplicaciones y nuevos componentes como Llama 3 Guard, un modelo de seguridad, y Prompt Guard, un filtro para la entrada de indicaciones. Ambos son de código abierto, lo que fomenta la transparencia y la colaboración en el ecosistema de IA.

Ecosistema Interoperable: Para facilitar la integración y el desarrollo de aplicaciones basadas en Llama, Meta ha puesto a disposición de los desarrolladores en GitHub el Llama Stack, un conjunto de interfaces que ayudarán a lograr una mayor interoperabilidad dentro del ecosistema de Llama.

En resumen, el lanzamiento de Llama 3.1 405B por parte de Meta representa un hito significativo en el mundo de la inteligencia artificial. Este modelo de código abierto ofrece capacidades excepcionales que rivalizan con los modelos cerrados más avanzados, y su desarrollo responsable y el fomento de un ecosistema interoperable lo convierten en una herramienta valiosa para impulsar la innovación en diversos sectores.