Los científicos de datos de la Escuela de Medicina Icahn en Mount Sinai en Nueva York y sus colegas han creado un modelo de inteligencia artificial que puede predecir con mayor precisión qué medicamentos existentes, que actualmente no están clasificados como dañinos, pueden de hecho provocar discapacidades congénitas.

El modelo, o « gráfico de conocimiento », descrito en la edición del 17 de julio de Naturejournal Communications Medicine, también tiene el potencial de predecir la participación de compuestos preclínicos que pueden dañar al feto en desarrollo. El estudio es el primero conocido de su tipo que utiliza gráficos de conocimiento para integrar varios tipos de datos para investigar las causas de las discapacidades congénitas.

Los defectos de nacimiento son anomalías que afectan aproximadamente a 1 de cada 33 nacimientos en los Estados Unidos. Pueden ser funcionales o estructurales y se cree que son el resultado de varios factores, incluida la genética. Sin embargo, las causas de la mayoría de estas discapacidades siguen siendo desconocidas. Ciertas sustancias que se encuentran en medicamentos, cosméticos, alimentos y contaminantes ambientales pueden provocar defectos de nacimiento si se exponen durante el embarazo.

« Queríamos mejorar nuestra comprensión de la salud reproductiva y el desarrollo fetal y, lo que es más importante, advertir sobre el potencial de los nuevos medicamentos para causar defectos de nacimiento antes de que estos medicamentos se comercialicen y distribuyan ampliamente », dice Avi Ma’ayan, PhD, Profesor de Ciencias Farmacológicas. y director del Centro de Bioinformática de Mount Sinai en Icahn Mount Sinai, y autor principal del artículo. « Aunque identificar las causas subyacentes es una tarea complicada, ofrecemos la esperanza de que a través de un análisis de datos complejo como este que integra evidencia de múltiples fuentes, seremos capaces, en algunos casos, de predecir, regular y proteger mejor contra el daño significativo que las discapacidades congénitas pueden causar ».

Los investigadores recopilaron conocimientos a través de varios conjuntos de datos sobre asociaciones de defectos congénitos anotados en trabajos publicados, incluidos los producidos por los programas del Fondo Común de los NIH, para demostrar cómo la integración de datos de estos recursos puede conducir a descubrimientos sinérgicos. En particular, los datos combinados provienen de la genética conocida de la salud reproductiva, la clasificación de medicamentos según su riesgo durante el embarazo y cómo los medicamentos y los compuestos preclínicos afectan los mecanismos biológicos dentro de las células humanas.

Específicamente, los datos incluyeron estudios sobre asociaciones genéticas, cambios en la expresión génica inducidos por fármacos y compuestos preclínicos en líneas celulares, objetivos farmacológicos conocidos, puntuaciones de carga genética para genes humanos y puntuaciones de cruce placentario para fármacos de molécula pequeña.

Es importante destacar que, utilizando ReproTox-KG, con aprendizaje semisupervisado (SSL), el equipo de investigación priorizó 30 000 medicamentos preclínicos de molécula pequeña por su potencial para atravesar la placenta e inducir defectos de nacimiento. SSL es una rama del aprendizaje automático que utiliza una pequeña cantidad de datos etiquetados para guiar las predicciones de datos mucho más grandes sin etiquetar. Además, al analizar la topología de ReproTox-KG, se identificaron más de 500 camarillas de defectos congénitos/genes/fármacos que podrían explicar los mecanismos moleculares que subyacen a los defectos congénitos inducidos por fármacos. En términos de teoría de grafos, las camarillas son subconjuntos de un gráfico donde todos los nodos de la camarilla están directamente conectados a todos los demás nodos de la camarilla.

Los investigadores advierten que los hallazgos del estudio son preliminares y que se necesitan más experimentos para su validación.

A continuación, los investigadores planean utilizar un enfoque similar basado en gráficos para otros proyectos centrados en la relación entre genes, fármacos y enfermedades. También tienen como objetivo utilizar el conjunto de datos procesados ​​como material de capacitación para cursos y talleres sobre análisis de bioinformática. Además, planean ampliar el estudio para considerar datos más complejos, como la expresión génica de tejidos específicos y tipos de células recolectados en múltiples etapas de desarrollo.

« Esperamos que nuestro trabajo colaborativo conduzca a un nuevo marco global para evaluar la toxicidad potencial de nuevos medicamentos y explicar los mecanismos biológicos por los cuales pueden operar algunos medicamentos, que se sabe que causan defectos de nacimiento. Es posible que en algún momento en el futuro, las agencias reguladoras como la Administración de Drogas y Alimentos de los EE. UU. y la Agencia de Protección Ambiental de los EE. UU. pueden usar este enfoque para evaluar el riesgo de nuevos medicamentos u otras aplicaciones químicas », dice el Dr. Ma’ayan.