En las últimas décadas, se han desarrollado muy pocos antibióticos nuevos, en gran parte porque los métodos actuales para detectar posibles fármacos son prohibitivamente caros y consumen mucho tiempo. Una nueva estrategia prometedora es utilizar modelos computacionales, que ofrecen una forma potencialmente más rápida y económica de identificar nuevos medicamentos.

Un nuevo estudio del MIT revela el potencial y las limitaciones de uno de esos enfoques computacionales. Usando estructuras de proteínas generadas por un programa de inteligencia artificial llamado AlphaFold, los investigadores exploraron si los modelos existentes podrían predecir con precisión las interacciones entre las proteínas bacterianas y los compuestos antibacterianos. Si es así, los investigadores podrían comenzar a usar este tipo de modelado para hacer pantallas a gran escala de nuevos compuestos que se dirijan a proteínas que antes no estaban dirigidas. Esto permitiría el desarrollo de antibióticos con mecanismos de acción sin precedentes, una tarea fundamental para hacer frente a la crisis de resistencia a los antibióticos.

Sin embargo, los investigadores, dirigidos por James Collins, profesor de Ingeniería y Ciencias Médicas de Termeer en el Instituto de Ingeniería y Ciencias Médicas (IMES) y el Departamento de Ingeniería Biológica del MIT, descubrieron que estos modelos existentes no funcionaban bien para este propósito. De hecho, sus predicciones funcionaron poco mejor que el azar.

«Los avances como AlphaFold están ampliando las posibilidades de los esfuerzos de descubrimiento de fármacos in silico, pero estos desarrollos deben combinarse con avances adicionales en otros aspectos del modelado que forman parte de los esfuerzos de descubrimiento de fármacos», dice Collins. «Nuestro estudio habla tanto de las capacidades actuales como de las limitaciones actuales de las plataformas computacionales para el descubrimiento de fármacos».

En su nuevo estudio, los investigadores pudieron mejorar el rendimiento de este tipo de modelos, conocidos como simulaciones de acoplamiento molecular, aplicando técnicas de aprendizaje automático para refinar los resultados. Sin embargo, se necesitarán más mejoras para aprovechar al máximo las estructuras de proteínas proporcionadas por AlphaFold, dicen los investigadores.

Collins es el autor principal del estudio, que aparece hoy en la revista Molecular Systems Biology. Los postdoctorados del MIT Felix Wong y Aarti Krishnan son los autores principales del artículo.

Interacciones moleculares

El nuevo estudio es parte de un esfuerzo lanzado recientemente por el laboratorio de Collins llamado Proyecto Antibióticos-IA, que tiene como objetivo utilizar la inteligencia artificial para descubrir y diseñar nuevos antibióticos.

AlphaFold, un software de inteligencia artificial desarrollado por DeepMind y Google, ha predicho con precisión las estructuras de proteínas a partir de sus secuencias de aminoácidos. Esta tecnología ha generado entusiasmo entre los investigadores que buscan nuevos antibióticos, quienes esperan poder usar las estructuras AlphaFold para encontrar fármacos que se unan a proteínas bacterianas específicas.

Para probar la viabilidad de esta estrategia, Collins y sus alumnos decidieron estudiar las interacciones de 296 proteínas esenciales de E. coli con 218 compuestos antibacterianos, incluidos antibióticos como las tetraciclinas.

Los investigadores analizaron cómo estos compuestos interactúan con las proteínas de E. coli mediante simulaciones de acoplamiento molecular, que predicen con qué fuerza se unirán dos moléculas en función de sus formas y propiedades físicas.

Este tipo de simulación se ha utilizado con éxito en estudios que analizan un gran número de compuestos frente a una sola proteína diana, para identificar los compuestos que se unen mejor. Pero en este caso, donde los investigadores estaban tratando de evaluar muchos compuestos contra muchos objetivos potenciales, las predicciones resultaron ser mucho menos precisas.

Al comparar las predicciones producidas por el modelo con las interacciones reales de 12 proteínas esenciales, obtenidas de experimentos de laboratorio, los investigadores encontraron que el modelo tenía tasas de falsos positivos similares a las tasas de verdaderos positivos. Eso sugiere que el modelo no pudo identificar de manera consistente las verdaderas interacciones entre los medicamentos existentes y sus objetivos.

Usando una medida que se usa a menudo para evaluar modelos computacionales, conocida como auROC, los investigadores también encontraron un rendimiento deficiente. «Utilizando estas simulaciones de acoplamiento molecular estándar, obtuvimos un valor de auROC de aproximadamente 0,5, lo que básicamente indica que no lo estás haciendo mejor que si estuvieras adivinando al azar», dice Collins.

Los investigadores encontraron resultados similares cuando utilizaron este enfoque de modelado con estructuras de proteínas determinadas experimentalmente, en lugar de las estructuras predichas por AlphaFold.

«AlphaFold parece funcionar más o menos tan bien como las estructuras determinadas experimentalmente, pero necesitamos hacer un mejor trabajo con los modelos de acoplamiento molecular si vamos a utilizar AlphaFold de manera efectiva y extensiva en el descubrimiento de fármacos», dice Collins.

Mejores predicciones

Una posible razón del bajo rendimiento del modelo es que las estructuras de proteínas alimentadas en el modelo son estáticas, mientras que en los sistemas biológicos, las proteínas son flexibles y, a menudo, cambian de configuración.

Para tratar de mejorar la tasa de éxito de su enfoque de modelado, los investigadores ejecutaron las predicciones a través de cuatro modelos adicionales de aprendizaje automático. Estos modelos se entrenan con datos que describen cómo las proteínas y otras moléculas interactúan entre sí, lo que les permite incorporar más información en las predicciones.

«Los modelos de aprendizaje automático aprenden no solo las formas, sino también las propiedades químicas y físicas de las interacciones conocidas, y luego usan esa información para reevaluar las predicciones de acoplamiento», dice Wong. «Descubrimos que si filtraba las interacciones utilizando esos modelos adicionales, podía obtener una mayor proporción de verdaderos positivos frente a falsos positivos».

Sin embargo, aún se necesitan mejoras adicionales antes de que este tipo de modelado pueda usarse para identificar con éxito nuevos medicamentos, dicen los investigadores. Una forma de hacer esto sería entrenar los modelos con más datos, incluidas las propiedades biofísicas y bioquímicas de las proteínas y sus diferentes conformaciones, y cómo esas características influyen en su unión con compuestos farmacológicos potenciales.

Con más avances, los científicos podrán aprovechar el poder de las estructuras de proteínas generadas por IA para descubrir no solo nuevos antibióticos sino también medicamentos para tratar una variedad de enfermedades, incluido el cáncer, dice Collins. «Somos optimistas de que con las mejoras en los enfoques de modelado y la expansión del poder de cómputo, estas técnicas serán cada vez más importantes en el descubrimiento de fármacos», dice. «Sin embargo, tenemos un largo camino por recorrer para lograr todo el potencial del descubrimiento de fármacos in silico».

La investigación fue financiada por la Fundación James S. McDonnell, la Fundación Nacional de Ciencias de Suiza, el Instituto Nacional de Alergias y Enfermedades Infecciosas, los Institutos Nacionales de Salud y el Instituto Broad del MIT y Harvard. El Proyecto Antibióticos-IA cuenta con el apoyo del Proyecto Audaz, el Laboratorio de gripe, la Fundación Sea Grape y la Fundación Wyss.