Los algoritmos de procesamiento de lenguaje natural (LNP en inglés) pueden ahora generar una secuencia de proteínas y predecir mutaciones de virus, incluso cambios fundamentales que ayudan al coronavirus a evadir el sistema inmunológico. Lo que hace esto posible es que muchas propiedades de los sistemas biológicos pueden ser interpretadas en términos de palabras y oraciones.
En los últimos años, un grupo de investigadores demostraron que las secuencias de proteínas y los códigos genéticos – que pueden ser representados como cadenas de letras – pueden modelarse usando técnicas NLP.
En un estudio publicado en la revista Science, Bonnie Berger, bióloga computacional en el MIT, junto a un grupo de colegas junta un grupo de estas cadenas y usa NLP para predecir mutaciones y permitir que los virus eviten ser detectados por los anticuerpos en el sistema inmunológico humano, un proceso conocido como escape viral inmune. La idea central es que la interpretación de un virus por un sistema inmunológico es análoga a la interpretación de una oración por una persona.
El equipo de Berger usa dos conceptos lingüísticos diferentes: gramática y semántica (o significado). La adecuación genética o evolutiva de un virus — que se caracteriza por la eficacia con que invade a su huésped – puede ser interpretada en términos de corrección gramática. Un virus infeccioso exitoso es gramáticamente correcto. Un virus no exitoso no lo es.
De manera similar, las mutaciones de un virus pueden ser interpretadas en términos de semántica. Lsa mutaciones que hacen que un virus haga cosas diferentes en su entorno – como cambios en la proteína de su superficie que lo hacen invisible a ciertos anticuerpos – han alterado su significado. Los virus con distintas mutaciones pueden tener diferentes significados y un virus con un significado diferente puede necesitar diferentes anticuerpos para que puedan leerlo.
El objetivo del método es identificar mutaciones que podrían permitir al virus escaparun sistema inmunológico sin hacerlo menos infeccioso, o sea mutaciones que cambian el significado del virus sin volverlo gramáticamente incorrecto.