Qué es Google Kelm

Google AI anunció Google KELM, una forma de reducir los prejuicios y el contenido tóxico y aumentar la precisión de los hechos. KELM se utiliza como método para reducir el sesgo en la búsqueda (Respuesta a preguntas de dominio abierto).

¿QUÉ ES GOOGLE KELM?

KELM es un acrónimo de Pre-formación del Modelo de Lenguaje Mejorado por el Conocimiento. Los modelos de procesamiento del lenguaje natural como BERT generalmente se entrenan en la web y otros documentos.

Google KELM sugiere agregar contenido fáctico confiable al entrenamiento previo del modelo de lenguaje para mejorar la precisión de los hechos y reducir el sesgo.

Los investigadores de Google sugirieron el uso de gráficos de conocimiento para mejorar la precisión de los hechos; después de todo, estos son una fuente confiable de datos.

PRECISIÓN FÁCTICA EN LOS RESULTADOS DE BÚSQUEDA DE GOOGLE

Google no ha comentado si KELM ya está en uso o no. Es un enfoque muy prometedor para la formación previa de modelos de lenguaje que se ha resumido en el Blog de IA de Google.

Google Kelm
Google Kelm

Actualmente, Google no verifica los resultados de la búsqueda en busca de hechos. En caso de introducirse Google KELM, podría tener un impacto en los sitios web que difunden ideas y declaraciones falsas. En última instancia, reducir el sesgo y aumentar la precisión de los hechos podría tener un impacto en la clasificación de los sitios web.

Sin embargo, mientras no se utilice KELM, todavía no hay forma de predecir el impacto que tendrá.

Google también ha indicado que la próxima generación del algoritmo MUM no se lanzará hasta que Google esté satisfecho de que el sesgo no afecta negativamente las respuestas que da. El enfoque KELM apunta específicamente a reducir la distorsión, lo que podría hacerlo valioso para el desarrollo del algoritmo MUM.

KELM PODRÍA INFLUIR EN ALGO MÁS QUE LA BÚSQUEDA DE GOOGLE

El KELM Corpus se publicó bajo una licencia Creative Commons (CC BY-SA 2.0). Esto significa que, en teoría, cualquier otra empresa también puede utilizarlo para mejorar su formación previa en el procesamiento del lenguaje natural. Por ejemplo, Bing, Facebook y Twitter también podrían beneficiarse de la nueva tecnología.

Por lo tanto, es posible que la influencia de KELM se extienda a muchas plataformas de búsqueda y redes sociales.

EL GRÁFICO DE CONOCIMIENTO DE GOOGLE

Google Knowledge Graph es una colección de hechos en un formato de datos estructurados. Los datos estructurados son un lenguaje de marcado que comunica cierta información de una manera que las máquinas pueden consumir fácilmente.

Google Knowledge Graph se introdujo en 2012 para ayudar a Google a comprender las relaciones entre las cosas. Entonces, si alguien pregunta sobre Washington, Google podría decir si el interrogador está preguntando sobre Washington, la persona, el estado o el Distrito de Columbia.

Se anunció que el gráfico de conocimiento de Google consistiría en datos de fuentes confiables con hechos. En su anuncio de 2012, Google se refirió al Gráfico de conocimiento como un primer paso hacia la construcción de la próxima generación de búsqueda que estamos disfrutando actualmente.

TEKGEN MEJORA LA PRECISIÓN FÁCTICA

Los investigadores señalan que un problema con la integración de la información de la base de conocimientos en la formación es que los datos de la base de conocimientos se encuentran en forma de datos estructurados.

La solución es convertir los datos estructurados del Gráfico de conocimiento en texto en lenguaje natural. Para hacer esto, se debe realizar una tarea de lenguaje natural llamada generación de datos a texto.

Debido a que la generación de datos a texto es un desafío, se ha desarrollado una nueva «canalización» llamada «Texto de KG Generator (TEKGEN)» para resolver el problema.

TEKGEN es la tecnología que desarrollaron los investigadores para convertir datos estructurados en texto en lenguaje natural. Este resultado final, un texto fáctico, se puede utilizar para crear el corpus KELM.

Qué Es Google Kelm
Qué es Google Kelm

Esto, a su vez, se puede utilizar como parte del entrenamiento previo para el aprendizaje automático para evitar que los sesgos fluyan hacia los algoritmos.

Los investigadores encontraron que agregar información adicional del Gráfico de conocimiento (corpus) a los datos de entrenamiento resultó en una mejor precisión de los hechos.

¿SE UTILIZARÁ GOOGLE KELM PRONTO?

El artículo de KELM publicado en el blog de inteligencia artificial de Google afirma que KELM se utiliza en el mundo real.

La tecnología se puede utilizar en particular para tareas de respuesta a preguntas que están explícitamente relacionadas con la recuperación de información (búsqueda) y el procesamiento del lenguaje natural (tecnologías como BERT y MUM).

El reciente anuncio de Google del algoritmo MUM requiere precisión. Esto es algo para lo que se creó el corpus KELM.

El hecho de que reducir el sesgo y la precisión de los hechos sea una preocupación fundamental en la sociedad actual, y que los investigadores sean optimistas acerca de los resultados, aumenta la probabilidad de que se utilice de alguna forma en la búsqueda en el futuro.