La aplicación de un método computacional basado en inteligencia artificial permite predecir la estructura tridimensional (3D) de las proteínas usando la simple secuencia de sus aminoácidos (codificada por sus genes).
Esta semana, el grupo de Demis Hassabis, de la empresa DeepMind (Londres, Reino Unido), en colaboración con el Instituto Europeo de Bioinformática (EMBL-EBI), ha logrado la predicción de todas las proteínas del proteoma humano usando el método computacional ‘AlphaFold’, el cual ha sido publicado en la revista ‘Nature’.
Y es que, saber predecir la estructura 3D de las proteínas humanas a partir de la secuencia de aminoácidos es decisivo para el desarrollo, por ejemplo, de nuevos fármacos y la mejora de la asistencia médica de multitud de enfermedades graves. Poder hacer esta predicción con precisión supone un logro extraordinario que rompe un reto de 50 años.
De hecho, hasta el año 2018 los mejores predictores sólo acertaban en torno a un 40 por ciento, si bien con el algoritmo ‘AlphaFold’ en su versión actual se ha podido alcanzar una precisión de hasta un 90-95 por ciento. Se trata de un algoritmo bioinformático basado en redes neuronales profundas (DNN, por sus siglas en inglés), que constituyen un área concreta del campo de la inteligencia artificial, conocido como Deep Learning, y que va a revolucionar seguro muchos otros campos de la investigación biomédica.
El avance realmente sobresaliente se dio hace año y medio y fue publicado también en la revista Nature, en enero de 2020. De hecho entre finales de 2019 y principios de 2020, el método ‘AlphaFold2’ arrasó en el concurso internacional de estructura de proteínas CASP, que se celebra desde 1994, con una puntuación media de precisión de 92,4 sobre 100.
Sin embargo, debido a que los investigadores de DeepMind no revelaron entonces los detalles del método y ni publicaron el código informático del algoritmo ‘AlphaFold’ usado para predecir la estructura de las proteínas, otros equipos se sintieron frustrados, incapaces de aprovechar el progreso en sus líneas de investigación. Esta situación empezó a cambiar la semana pasada gracias a la competencia entre grupos de investigación.
El 15 de julio de 2021, investigadores dirigidos por David Baker y Minkyung Baek de la Universidad de Washington (Estados Unidos) informaron en la revista ‘Science’ de que habían creado un programa de predicción de la estructura de proteínas de alta precisión llamado ‘RoseTTAFold’, también basado en redes neuronales y cuyo código publicaron en abierto.
Ante esta publicación, el mismo día 15 la revista ‘Nature’ reveló detalles de AlphaFold en el artículo de los investigadores de DeepMind dirigidos por Demis Hassabis y John Jumper, en el que hacen público y accesible el método. Este artículo aparece en el mismo volumen de Nature junto al otro del mismo grupo (de fecha 22 de julio) que se ha citado antes y publica la predicción con alta precisión de la estructura de todas proteínas del proteoma humano, es decir del 98,5 por ciento de las proteínas humanas.
«Es mi opinión, es muy importante para el avance de la ciencia que los investigadores hayan publicado los detalles del algoritmo y del método de inteligencia artificial usado para lograr este paso tan transcendente que corona el esfuerzo de 50 años de investigación sobre la estructura tridimensional de las proteínas. La publicación del método nos permitirá aplicarlo a otros estudios específicos de proteínas que estamos realizando por ejemplo en nuestro grupo del Consejo Superior de Investigaciones Científicas (CSIC). Además, la aplicación de estos métodos computacionales en biomedicina se verá reflejada, sin lugar a duda, en la mejora de la asistencia médica en plazos más breves de lo que podíamos predecir hasta ahora», ha dicho el investigador del CSIC Javier De Las Rivas.