Las enzimas juegan un papel clave en los procesos metabólicos celulares. Para permitir la evaluación cuantitativa de estos procesos, los investigadores necesitan conocer el llamado « número de rotación » (para abreviar: kcat) de las enzimas. En la revista científica Nature Communications, un equipo de bioinformáticos de la Universidad Heinrich Heine de Düsseldorf (HHU) describe ahora una herramienta para predecir este parámetro para varias enzimas utilizando métodos de IA.
Las enzimas son biocatalizadores importantes en todas las células vivas. Normalmente son proteínas grandes, que se unen a moléculas más pequeñas (los llamados sustratos) y luego las convierten en otras moléculas, los « productos ». Sin enzimas, la reacción que convierte los sustratos en productos no podría tener lugar, o sólo podría hacerlo a una velocidad muy baja. La mayoría de los organismos poseen miles de enzimas diferentes. Las enzimas tienen muchas aplicaciones en una amplia gama de procesos biotecnológicos y en la vida cotidiana, desde la fermentación de la masa de pan hasta los detergentes.
La velocidad máxima a la que una enzima específica puede convertir sus sustratos en productos está determinada por el llamado número de recambio kcat. Es un parámetro importante para la investigación cuantitativa sobre las actividades enzimáticas y juega un papel clave en la comprensión del metabolismo celular.
Sin embargo, es lento y costoso determinar los números de recambio de kcat en los experimentos, por lo que no se conocen en la gran mayoría de las reacciones. El grupo de investigación de Biología Celular Computacional de HHU, encabezado por el profesor Dr. Martin Lercher, ha desarrollado una nueva herramienta llamada TurNuP para predecir el número de enzimas de recambio de kcat utilizando métodos de IA.
Para entrenar un modelo de predicción de kcat, la información sobre las enzimas y las reacciones catalizadas se convirtió en vectores numéricos utilizando modelos de aprendizaje profundo. Estos vectores numéricos sirvieron como entrada para un modelo de aprendizaje automático, el llamado modelo de aumento de gradiente, que predice los números de rotación de kcat.
El autor principal, Alexander Kroll: « TurNuP supera a los modelos anteriores e incluso puede usarse con éxito para enzimas que tienen solo una similitud baja con las del conjunto de datos de entrenamiento ». Los modelos anteriores no han podido hacer predicciones significativas a menos que al menos el 40% de la secuencia de la enzima sea idéntica a al menos una enzima en el conjunto de entrenamiento. Por el contrario, TurNuP ya puede hacer predicciones significativas para enzimas con una identidad de secuencia máxima de 0 a 40 %.
El profesor Lercher agrega: « En nuestro estudio, mostramos que las predicciones hechas por TurNuP se pueden usar para predecir las concentraciones de enzimas en las células vivas con mucha más precisión que hasta la fecha ».
Para que el modelo de predicción sea fácilmente accesible para la mayor cantidad de usuarios posible, el equipo de HHU ha desarrollado un servidor web fácil de usar, que otros investigadores pueden usar para predecir el número de enzimas de recambio de kcat.
Enlace al servidor web: https://turnup.cs.hhu.de/
Antecedentes: aprendizaje automático y aprendizaje profundo
Los modelos de aprendizaje profundo comprenden redes neuronales artificiales de varias capas que pueden reconocer y procesar patrones en los datos de entrada. El uso de grandes conjuntos de datos de entrenamiento es la forma óptima de entrenar un modelo de aprendizaje profundo para procesar entradas numéricas.
Los modelos de aumento de gradiente son un método de aprendizaje automático que produce una gran cantidad de árboles de decisión. Los resultados de todos los árboles de decisión para una entrada específica se utilizan para hacer predicciones. Similar al aprendizaje profundo, los datos de entrenamiento se utilizan para refinar el modelo, es decir, para producir los árboles de decisión.