La disposición de los electrones en la materia, conocida como estructura electrónica, juega un papel crucial en la investigación fundamental pero también aplicada, como el diseño de fármacos y el almacenamiento de energía. Sin embargo, la falta de una técnica de simulación que ofrezca alta fidelidad y escalabilidad en diferentes escalas de tiempo y duración ha sido durante mucho tiempo un obstáculo para el progreso de estas tecnologías. Investigadores del Centro para la Comprensión de Sistemas Avanzados (CASUS) en Helmholtz-Zentrum Dresden-Rossendorf (HZDR) en Görlitz, Alemania, y los Laboratorios Nacionales Sandia en Albuquerque, Nuevo México, EE. UU., ahora han sido pioneros en un método de simulación basado en el aprendizaje automático ( npj Computational Materials), que reemplaza las técnicas tradicionales de simulación de estructuras electrónicas. Su pila de software de algoritmos de aprendizaje de materiales (MALA) permite el acceso a escalas de longitud previamente inalcanzables.

Los electrones son partículas elementales de fundamental importancia. Sus interacciones mecánicas cuánticas entre sí y con los núcleos atómicos dan lugar a una multitud de fenómenos observados en química y ciencia de los materiales. Comprender y controlar la estructura electrónica de la materia proporciona información sobre la reactividad de las moléculas, la estructura y el transporte de energía dentro de los planetas y los mecanismos de falla del material.

Los desafíos científicos se abordan cada vez más a través del modelado y la simulación computacionales, aprovechando las capacidades de la computación de alto rendimiento. Sin embargo, un obstáculo importante para lograr simulaciones realistas con precisión cuántica es la falta de una técnica de modelado predictivo que combine alta precisión con escalabilidad en diferentes escalas de duración y tiempo. Los métodos clásicos de simulación atomística pueden manejar sistemas grandes y complejos, pero su omisión de la estructura electrónica cuántica restringe su aplicabilidad. Por el contrario, los métodos de simulación que no se basan en suposiciones como el modelado empírico y el ajuste de parámetros (métodos de primeros principios) proporcionan alta fidelidad pero son computacionalmente exigentes. Por ejemplo, la teoría funcional de la densidad (DFT), un método de primeros principios ampliamente utilizado, muestra una escala cúbica con el tamaño del sistema, lo que restringe sus capacidades predictivas a escalas pequeñas.

Enfoque híbrido basado en el aprendizaje profundo

El equipo de investigadores presentó ahora un método de simulación novedoso llamado pila de software de algoritmos de aprendizaje de materiales (MALA). En informática, una pila de software es una colección de algoritmos y componentes de software que se combinan para crear una aplicación de software para resolver un problema en particular. Lenz Fiedler, un Ph.D. estudiante y desarrollador clave de MALA en CASUS, explica: « MALA integra el aprendizaje automático con enfoques basados ​​en la física para predecir la estructura electrónica de los materiales. Emplea un enfoque híbrido, utilizando un método de aprendizaje automático establecido llamado aprendizaje profundo para predecir con precisión cantidades locales, complementado con algoritmos físicos para calcular cantidades globales de interés ».

La pila de software MALA toma como entrada la disposición de los átomos en el espacio y genera huellas dactilares conocidas como componentes biespectro, que codifican la disposición espacial de los átomos alrededor de un punto de cuadrícula cartesiano. El modelo de aprendizaje automático en MALA está entrenado para predecir la estructura electrónica basada en este vecindario atómico. Una ventaja significativa de MALA es la capacidad de su modelo de aprendizaje automático de ser independiente del tamaño del sistema, lo que le permite entrenarse con datos de sistemas pequeños e implementarse a cualquier escala.

En su publicación, el equipo de investigadores mostró la notable eficacia de esta estrategia. Lograron una aceleración de más de 1000 veces para sistemas de menor tamaño, que constan de unos pocos miles de átomos, en comparación con los algoritmos convencionales. Además, el equipo demostró la capacidad de MALA para realizar con precisión cálculos de estructuras electrónicas a gran escala, con más de 100 000 átomos. En particular, este logro se logró con un esfuerzo computacional modesto, lo que revela las limitaciones de los códigos DFT convencionales.

Attila Cangi, jefe interino del Departamento de Materia en Condiciones Extremas de CASUS, explica: « A medida que aumenta el tamaño del sistema y hay más átomos involucrados, los cálculos DFT se vuelven poco prácticos, mientras que la ventaja de velocidad de MALA continúa creciendo. El avance clave de MALA radica en su capacidad para operar en entornos atómicos locales, lo que permite predicciones numéricas precisas que se ven mínimamente afectadas por el tamaño del sistema. Este logro innovador abre posibilidades computacionales que alguna vez se consideraron inalcanzables ».

Se espera impulso a la investigación aplicada

Cangi tiene como objetivo ampliar los límites de los cálculos de estructuras electrónicas aprovechando el aprendizaje automático: « Anticipamos que MALA provocará una transformación en los cálculos de estructuras electrónicas, ya que ahora tenemos un método para simular sistemas significativamente más grandes a una velocidad sin precedentes. En el futuro, los investigadores podrá abordar una amplia gama de desafíos sociales basados ​​en una línea de base significativamente mejorada, incluido el desarrollo de nuevas vacunas y materiales novedosos para el almacenamiento de energía, la realización de simulaciones a gran escala de dispositivos semiconductores, el estudio de defectos materiales y la exploración de reacciones químicas para convertir la atmósfera dióxido de carbono, gas de efecto invernadero, en minerales inocuos para el clima ».

Además, el enfoque de MALA es especialmente adecuado para la computación de alto rendimiento (HPC). A medida que crece el tamaño del sistema, MALA permite el procesamiento independiente en la cuadrícula computacional que utiliza, aprovechando de manera efectiva los recursos de HPC, en particular las unidades de procesamiento gráfico. Siva Rajamanickam, científica del personal y experta en computación paralela en los Laboratorios Nacionales de Sandia, explica: « El algoritmo de MALA para cálculos de estructuras electrónicas se corresponde bien con los sistemas HPC modernos con aceleradores distribuidos. La capacidad de descomponer el trabajo y ejecutar en paralelo diferentes puntos de cuadrícula en diferentes Los aceleradores hacen de MALA una combinación ideal para el aprendizaje automático escalable en los recursos de HPC, lo que lleva a una velocidad y eficiencia sin precedentes en los cálculos de estructuras electrónicas ».

Además de los socios en desarrollo HZDR y Sandia National Laboratories, MALA ya está empleada por instituciones y empresas como el Instituto de Tecnología de Georgia, la Universidad Estatal A&T de Carolina del Norte, Sambanova Systems Inc. y Nvidia Corp.