Ningún actor tecnológico ha logrado equipararse a ChatGPT en términos de impacto durante los últimos 12 meses que abarcaron el año 2023. A pesar de las controversias que rodean a su CEO y la disminución de usuarios, el chatbot conversacional de OpenAI continúa atrayendo a diario a millones de usuarios que aprovechan sus capacidades para abordar aspectos académicos, laborales y de entretenimiento. Sin embargo, según un informe reciente, la versión gratuita del bot se encuentra ligeramente rezagada en comparación con una inteligencia artificial de la década de 1960.

1La IA de hace 60 años demuestra que era mejor
Hace más de cincuenta años, Joseph Weizenbaum, un investigador del MIT, creó ELIZA con objetivos educativos y psicológicos. En esencia, este chatbot fue diseñado para revelar la superficialidad de las interacciones entre humanos y máquinas. A día de hoy, su influencia sigue siendo significativa, especialmente para aquellos que buscan explorar las capacidades del Test de Turing, una prueba diseñada para distinguir entre un ser humano y una máquina.
Un grupo de investigadores de la Universidad de California en San Diego emprendió un estudio titulado «¿Pasa GPT-4 la prueba de Turing?» con la intención de determinar si la versión más avanzada de OpenAI podía discernir entre interacciones con humanos y máquinas. De manera más ambiciosa, incluyeron en su análisis a GPT-3.5, el modelo de lenguaje subyacente en la versión gratuita de ChatGPT, así como a la mencionada ELIZA y a 652 participantes. El resultado fue sorprendentemente favorable para ELIZA, pero menos alentador para GPT-3.5. En el 27% de las instancias, la empresa pudo distinguir si estaba conversando con un humano o una máquina, mientras que este porcentaje disminuyó al 14% en el caso de GPT-3.5. Afortunadamente para OpenAI, GPT-4 demostró tener un rendimiento del 41%, aunque todavía se sitúa por debajo de la capacidad humana en este aspecto.