La inteligencia artificial puede predecir la actividad dentro y fuera del objetivo de las herramientas CRISPR que se dirigen al ARN en lugar del ADN, según una nueva investigación publicada en Nature Biotechnology.
El estudio realizado por investigadores de la Universidad de Nueva York, Columbia Engineering y el Centro del Genoma de Nueva York combina un modelo de aprendizaje profundo con pantallas CRISPR para controlar la expresión de los genes humanos de diferentes maneras, como encender un interruptor de luz para apagarlos por completo. o usando una perilla de atenuación para reducir parcialmente su actividad. Estos controles genéticos precisos podrían usarse para desarrollar nuevas terapias basadas en CRISPR.
CRISPR es una tecnología de edición de genes con muchos usos en la biomedicina y más allá, desde el tratamiento de la anemia de células falciformes hasta la ingeniería de hojas de mostaza más sabrosas. A menudo funciona apuntando al ADN usando una enzima llamada Cas9. En los últimos años, los científicos descubrieron otro tipo de CRISPR que, en cambio, se dirige al ARN utilizando una enzima llamada Cas13.
Los CRISPR dirigidos al ARN se pueden usar en una amplia gama de aplicaciones, incluida la edición de ARN, la eliminación del ARN para bloquear la expresión de un gen en particular y la detección de alto rendimiento para determinar candidatos a fármacos prometedores. Investigadores de la NYU y el Centro del Genoma de Nueva York crearon una plataforma para pantallas CRISPR dirigidas al ARN utilizando Cas13 para comprender mejor la regulación del ARN e identificar la función de los ARN no codificantes. Debido a que el ARN es el material genético principal en virus, incluidos el SARS-CoV-2 y la gripe, los CRISPR dirigidos al ARN también son prometedores para desarrollar nuevos métodos para prevenir o tratar infecciones virales. Además, en las células humanas, cuando se expresa un gen, uno de los primeros pasos es la creación de ARN a partir del ADN del genoma.
Un objetivo clave del estudio es maximizar la actividad de los CRISPR dirigidos al ARN en el ARN objetivo previsto y minimizar la actividad en otros ARN que podrían tener efectos secundarios perjudiciales para la célula. La actividad fuera del objetivo incluye tanto los desajustes entre la guía y el ARN objetivo como las mutaciones de inserción y deleción. Los estudios anteriores de CRISPR dirigidos al ARN se centraron solo en la actividad en el objetivo y los desajustes; la predicción de la actividad fuera del objetivo, en particular las mutaciones de inserción y deleción, no ha sido bien estudiada. En las poblaciones humanas, aproximadamente una de cada cinco mutaciones son inserciones o eliminaciones, por lo que estos son tipos importantes de posibles objetivos no deseados a considerar para el diseño de CRISPR.
« De manera similar a los CRISPR dirigidos al ADN como Cas9, anticipamos que los CRISPR dirigidos al ARN como Cas13 tendrán un impacto enorme en la biología molecular y las aplicaciones biomédicas en los próximos años », dijo Neville Sanjana, profesor asociado de biología en NYU, asociado profesor de neurociencia y fisiología en la Escuela de Medicina Grossman de la NYU, miembro principal de la facultad en el Centro del Genoma de Nueva York y coautor principal del estudio. « La predicción precisa de la guía y la identificación fuera del objetivo serán de gran valor para este nuevo campo y terapia en desarrollo ».
En su estudio en Nature Biotechnology, Sanjana y sus colegas realizaron una serie de pantallas CRISPR dirigidas a ARN agrupadas en células humanas. Midieron la actividad de 200.000 ARN guía dirigidos a genes esenciales en células humanas, incluidos ARN guía de « coincidencia perfecta » y desajustes, inserciones y deleciones fuera del objetivo.
El laboratorio de Sanjana se asoció con el laboratorio del experto en aprendizaje automático David Knowles para diseñar un modelo de aprendizaje profundo que llamaron TIGER (Inhibición dirigida de la expresión génica a través del diseño de guía de ARN) que se entrenó en los datos de las pantallas CRISPR. Al comparar las predicciones generadas por el modelo de aprendizaje profundo y las pruebas de laboratorio en células humanas, TIGER pudo predecir la actividad tanto dentro como fuera del objetivo, superando a los modelos anteriores desarrollados para el diseño de la guía en el objetivo Cas13 y proporcionando la primera herramienta para predecir fuera del objetivo. -Actividad objetivo de CRISPR dirigidos a ARN.
« El aprendizaje automático y el aprendizaje profundo están mostrando su fuerza en la genómica porque pueden aprovechar los enormes conjuntos de datos que ahora pueden generar los experimentos modernos de alto rendimiento. Es importante destacar que también pudimos usar el « aprendizaje automático interpretable » para comprender por qué el modelo predice que una guía específica funcionará bien », dijo Knowles, profesor asistente de ciencias de la computación y biología de sistemas en Columbia Engineering, miembro principal de la facultad en el Centro del Genoma de Nueva York y coautor principal del estudio.
« Nuestra investigación anterior demostró cómo diseñar guías Cas13 que pueden anular un ARN en particular. Con TIGER, ahora podemos diseñar guías Cas13 que logran un equilibrio entre la anulación en el objetivo y evitar la actividad fuera del objetivo », dijo Hans-Hermann (Harm ) Wessels, coautor del estudio y científico principal en el Centro del Genoma de Nueva York, quien anteriormente fue becario postdoctoral en el laboratorio de Sanjana.
Los investigadores también demostraron que las predicciones fuera del objetivo de TIGER se pueden usar para modular con precisión la dosis de genes (la cantidad de un gen particular que se expresa) al permitir la inhibición parcial de la expresión de genes en células con guías de desajuste. Esto puede ser útil para enfermedades en las que hay demasiadas copias de un gen, como el síndrome de Down, ciertas formas de esquizofrenia, la enfermedad de Charcot-Marie-Tooth (un trastorno nervioso hereditario) o en cánceres en los que la expresión génica aberrante puede conducir a Crecimiento tumoral descontrolado.
« Nuestro modelo de aprendizaje profundo puede decirnos no solo cómo diseñar un ARN guía que elimine una transcripción por completo, sino que también puede ‘ajustarlo’, por ejemplo, hacer que produzca solo el 70% de la transcripción de un gen específico ». dijo Andrew Stirn, estudiante de doctorado en Ingeniería de Columbia y el Centro del Genoma de Nueva York, y coautor del estudio.
Al combinar la inteligencia artificial con una pantalla CRISPR dirigida al ARN, los investigadores prevén que las predicciones de TIGER ayudarán a evitar la actividad CRISPR fuera del objetivo no deseado y estimularán aún más el desarrollo de una nueva generación de terapias dirigidas al ARN.
« A medida que recopilamos conjuntos de datos más grandes de las pantallas CRISPR, las oportunidades de aplicar modelos sofisticados de aprendizaje automático aumentan rápidamente. Tenemos la suerte de tener el laboratorio de David al lado del nuestro para facilitar esta maravillosa colaboración interdisciplinaria. Y, con TIGER, podemos predecir objetivos no deseados y modular con precisión la dosis de genes, lo que permite muchas aplicaciones nuevas y emocionantes para CRISPR dirigidos al ARN para biomedicina », dijo Sanjana.
Otros autores del estudio incluyen a Alejandro Méndez-Mancilla y Sydney K. Hart de la Universidad de Nueva York y el Centro del Genoma de Nueva York, y Eric J. Kim de la Universidad de Columbia. La investigación fue apoyada por subvenciones de los Institutos Nacionales de Salud (DP2HG010099, R01CA218668, R01GM138635), DARPA (D18AP00053), el Instituto de Investigación del Cáncer y la Iniciativa de Investigación de la Fundación Simons para el Autismo.