Los científicos han aplicado con éxito el aprendizaje por refuerzo a un desafío en biología molecular.

El equipo de investigadores desarrolló un nuevo y potente software de diseño de proteínas adaptado a partir de una estrategia probada en juegos de mesa como Chess and Go. En un experimento, se descubrió que las proteínas fabricadas con el nuevo enfoque eran más eficaces para generar anticuerpos útiles en ratones.

Los hallazgos, publicados el 21 de abril en Science, sugieren que este avance podría conducir pronto a vacunas más potentes. En términos más generales, el enfoque podría conducir a una nueva era en el diseño de proteínas.

« Nuestros resultados muestran que el aprendizaje por refuerzo puede hacer más que dominar los juegos de mesa. Cuando se entrenó para resolver acertijos de larga data en la ciencia de las proteínas, el software se destacó en la creación de moléculas útiles », dijo el autor principal David Baker, profesor de bioquímica en la Facultad de Ciencias de la Universidad de Washington. Medicina en Seattle y ganador del Premio Breakthrough 2021 en Ciencias de la Vida.

« Si este método se aplica a los problemas de investigación correctos », dijo, « podría acelerar el progreso en una variedad de campos científicos ».

La investigación es un hito en el aprovechamiento de la inteligencia artificial para realizar investigaciones científicas sobre proteínas. Las aplicaciones potenciales son amplias, desde el desarrollo de tratamientos contra el cáncer más efectivos hasta la creación de nuevos textiles biodegradables.

El aprendizaje por refuerzo es un tipo de aprendizaje automático en el que un programa de computadora aprende a tomar decisiones probando diferentes acciones y recibiendo retroalimentación. Dicho algoritmo puede aprender a jugar al ajedrez, por ejemplo, probando millones de movimientos diferentes que conducen a la victoria o la derrota en el tablero. El programa está diseñado para aprender de estas experiencias y mejorar en la toma de decisiones con el tiempo.

Para hacer un programa de aprendizaje por refuerzo para el diseño de proteínas, los científicos le dieron a la computadora millones de moléculas iniciales simples. Luego, el software hizo diez mil intentos de mejorar aleatoriamente cada uno hacia un objetivo predefinido. La computadora alargó las proteínas o las dobló de formas específicas hasta que aprendió a contorsionarlas en las formas deseadas.

Isaac D. Lutz, Shunzhi Wang y Christoffer Norn, todos miembros del Baker Lab, dirigieron la investigación. El manuscrito de Science de su equipo se titula « Diseño de arriba hacia abajo de arquitecturas de proteínas con aprendizaje de refuerzo ».

« Nuestro enfoque es único porque utilizamos el aprendizaje por refuerzo para resolver el problema de crear formas de proteínas que encajan como piezas de un rompecabezas », explicó el coautor principal Lutz, estudiante de doctorado en el Instituto de Medicina para el Diseño de Proteínas de la UW. « Esto simplemente no fue posible usando enfoques anteriores y tiene el potencial de transformar los tipos de moléculas que podemos construir ».

Como parte de este estudio, los científicos fabricaron cientos de proteínas diseñadas por IA en el laboratorio. Usando microscopios electrónicos y otros instrumentos, confirmaron que muchas de las formas de proteínas creadas por la computadora se realizaron en el laboratorio.

« Este enfoque demostró no solo ser preciso sino también altamente personalizable. Por ejemplo, le pedimos al software que hiciera estructuras esféricas sin agujeros, agujeros pequeños o agujeros grandes. Su potencial para hacer todo tipo de arquitecturas aún no se ha explorado por completo ». dijo el coautor principal Shunzhi Wang, investigador postdoctoral en el Instituto de Medicina para el Diseño de Proteínas de la UW.

El equipo se concentró en diseñar nuevas estructuras a escala nanométrica compuestas por muchas moléculas de proteína. Esto requirió diseñar tanto los componentes de la proteína como las interfaces químicas que permiten que las nanoestructuras se autoensamblen.

La microscopía electrónica confirmó que numerosas nanoestructuras diseñadas por IA pudieron formarse en el laboratorio. Como medida de cuán preciso se había vuelto el software de diseño, los científicos observaron muchas nanoestructuras únicas en las que se encontró que cada átomo estaba en el lugar previsto. En otras palabras, la desviación entre la nanoestructura prevista y la realizada fue, en promedio, menor que el ancho de un solo átomo. Esto se llama diseño atómicamente preciso.

Los autores prevén un futuro en el que este enfoque podría permitirles a ellos y a otros crear proteínas terapéuticas, vacunas y otras moléculas que no podrían haberse fabricado con métodos anteriores.

Investigadores del Instituto de Medicina para Células Madre y Medicina Regenerativa de la UW utilizaron modelos de células primarias de células de vasos sanguíneos para demostrar que los andamios de proteínas diseñados superaron a las versiones anteriores de la tecnología. Por ejemplo, debido a que los receptores que ayudan a las células a recibir e interpretar señales se agruparon más densamente en los andamios más compactos, fueron más efectivos para promover la estabilidad de los vasos sanguíneos.

Hannele Ruohola-Baker, profesora de bioquímica de la Facultad de Medicina de la UW y una de las autoras del estudio, habló sobre las implicaciones de la investigación para la medicina regenerativa : « Cuanto más precisa se vuelve la tecnología, más aplicaciones potenciales abre, incluidos los tratamientos vasculares para diabetes, lesiones cerebrales, accidentes cerebrovasculares y otros casos en los que los vasos sanguíneos están en riesgo. También podemos imaginar una entrega más precisa de factores que usamos para diferenciar las células madre en varios tipos de células, lo que nos brinda nuevas formas de regular los procesos de desarrollo celular. y el envejecimiento ».

Este trabajo fue financiado por los Institutos Nacionales de Salud (P30 GM124169, S10OD018483, 1U19AG065156-01, T90 DE021984, 1P01AI167966); Open Philanthropy Project y The Audacious Project en el Instituto para el Diseño de Proteínas; Fundación Novo Nordisk (NNF170C0030446); microsoft; y Amgen. La investigación se realizó en parte en Advanced Light Source, una instalación de usuario nacional operada por el Laboratorio Nacional Lawrence Berkeley en nombre del Departamento de Energía.

Comunicado de prensa escrito por Ian Haydon, UW Medicine Institute for Protein Design.