Meta presenta ‘Husky’, un agente lingüístico para realizar tareas de razonamiento

Los agentes lingüísticos se han caracterizado tradicionalmente por el uso de modelos de lenguaje grandes (LLM) propietarios o por estar diseñados para realizar tareas específicas dentro de un dominio concreto. Sin embargo, un grupo de investigadores de Meta, la Universidad de Washington y el Instituto Allen para la Inteligencia Artificial, han presentado un enfoque diferente con el desarrollo de Husky.

Husky es un agente lingüístico de código abierto que ha sido diseñado para abordar un conjunto diverso de tareas complejas que involucran razonamiento numérico, tabular y basado en el conocimiento. Este enfoque innovador representa un avance significativo en el campo de los agentes lingüísticos, ofreciendo una solución más versátil y adaptable a una amplia gama de problemas.

La Arquitectura Innovadora de Husky

Husky se caracteriza por un procedimiento en dos partes: la generación de la acción y la ejecución de la acción. En la primera etapa, el modelo predice la acción a realizar y la herramienta necesaria para llevarla a cabo. En la segunda etapa, el modelo y la herramienta ejecutan la acción y actualizan el estado de la solución utilizando una ontología predefinida de acciones, hasta que se alcanza el estado final de la tarea.

Esta arquitectura permite que Husky descomponga cada tarea en una serie de acciones, utilizando la herramienta adecuada para cada una de ellas. De esta manera, el agente lingüístico puede abordar una amplia variedad de tareas complejas de manera eficiente y efectiva.

El Rendimiento Destacado de Husky

Los investigadores han destacado que Husky utiliza modelos de lenguaje grande (LLM) de 7.000 millones de parámetros, lo cual le permite igualar o superar el rendimiento de otros modelos de lenguaje frontera, como GPT-4, en las tareas analizadas.

Este desempeño sobresaliente de Husky demuestra la eficacia de su enfoque de razonamiento unificado y subraya su potencial para convertirse en una herramienta valiosa en una amplia gama de aplicaciones que requieren tareas de razonamiento complejas.