Facebook ha publicado una nueva base de datos de vídeos para entrenar a modelos de Inteligencia Artificial (IA), y en este caso la compañía ha intentado combatir el sesgo de este tipo de sistemas utilizando material en el que son los propios retratados quienes introducen sus datos de edad y sexo.
Casual Conversations, como se conoce a la base de datos, supone una alternativa a las bases de datos actuales, que habitualmente utilizan datos proporcionados por terceros o estimaciones mediante aprendizaje automático.
En este caso, es la primera vez que se ha pagado a las personas que aparecen en las imágenes por añadir manualmente su edad y sexo, según ha informado la unidad de Facebook especializada en IA a través de un comunicado.
Este enfoque centrado en las personas permite que la nueva base de datos tenga una «visión relativamente imparcial de la edad y el género», evitando los sesgos de género o de raza que habitualmente afectan a los sistema de IA.
Casual Conversations, que ha sido publicado de manera abierta por Facebook, consta de un total de 45.186 vídeos de 3.011 personas que tienen conversaciones no guionizadas.
La compañía estadounidense ha explicado que puede resultar útil a los investigadores en IA para «evaluar la equidad de su visión computerizada y modelos de audio en subgrupos de edad, género, tono de piel aparente e iluminación ambiental».
Asimismo, la base de datos creada por Facebook emplea también información con etiquetas sobre la iluminación ambiental de cada vídeo y el tono de piel de las personas, de manera que también puede utilizarse para calibrar la efectividad de la IA en clasificar a personas según su raza independientemente de las condiciones de luz.
Facebook continuará trabajando en Casual Conversations, y asegura que hará que la base de datos sea más inclusiva con la incorporación de más identidades de género (no solo hombre y mujer), edades, localizaciones geográficas (la muestra inicial es solo de Estados Unidos), actividades y otras características.