La misma tecnología de inteligencia artificial utilizada para imitar el arte humano ahora puede sintetizar datos científicos artificiales, lo que hace avanzar los esfuerzos hacia el análisis de datos totalmente automatizado.

Investigadores de la Universidad de Illinois Urbana-Champaign han desarrollado una IA que genera datos artificiales a partir de experimentos de microscopía comúnmente utilizados para caracterizar estructuras materiales a nivel atómico. A partir de la tecnología subyacente a los generadores de arte, la IA permite a los investigadores incorporar ruido de fondo e imperfecciones experimentales en los datos generados, lo que permite que las características del material se detecten mucho más rápido y de manera más eficiente que antes.

« Las IA generativas toman información y generan cosas nuevas que no existían antes en el mundo, y ahora hemos aprovechado eso para el objetivo del análisis de datos automatizado », dijo Pinshane Huang, profesor de ciencia de materiales y de la U. de I. ingeniería y co-líder del proyecto. « Lo que se usa para hacer pinturas de llamas al estilo de Monet en Internet ahora puede hacer que los datos científicos sean tan buenos que me engañen a mí y a mis colegas ».

Otras formas de inteligencia artificial y aprendizaje automático se utilizan de forma rutinaria en la ciencia de los materiales para ayudar con el análisis de datos, pero requieren una intervención humana frecuente y que consume mucho tiempo. Hacer que estas rutinas de análisis sean más eficientes requiere un gran conjunto de datos etiquetados para mostrarle al programa qué buscar. Además, el conjunto de datos debe tener en cuenta una amplia gama de ruido de fondo e imperfecciones experimentales para ser efectivo, efectos que son difíciles de modelar.

Dado que recopilar y etiquetar un conjunto de datos tan vasto con un microscopio real es inviable, Huang trabajó con el profesor de física de la U. de I. Bryan Clark para desarrollar una IA generativa que podría crear un gran conjunto de datos de entrenamiento artificial a partir de un conjunto comparativamente pequeño de datos reales. datos etiquetados. Para lograr esto, los investigadores utilizaron una red antagónica generativa de ciclo, o CycleGAN.

« Puedes pensar en un CycleGAN como una competencia entre dos entidades », dijo Clark. « Hay un ‘generador’ cuyo trabajo es imitar un conjunto de datos provisto, y hay un ‘discriminador’ cuyo trabajo es detectar las diferencias entre el generador y los datos reales. lo que el otro pudo hacer. En última instancia, el generador puede producir datos artificiales que son prácticamente indistinguibles de los datos reales ».

Al proporcionar a CycleGAN una pequeña muestra de imágenes microscópicas reales, la IA aprendió a generar imágenes que se usaron para entrenar la rutina de análisis. Ahora es capaz de reconocer una amplia gama de características estructurales a pesar del ruido de fondo y las imperfecciones sistemáticas.

« La parte notable de esto es que nunca tuvimos que decirle a la IA qué son cosas como el ruido de fondo y las imperfecciones como la aberración en el microscopio », dijo Clark. « Eso significa que incluso si hay algo en lo que no habíamos pensado, CycleGAN puede aprenderlo y funcionar con él ».

El grupo de investigación de Huang ha incorporado CycleGAN en sus experimentos para detectar defectos en semiconductores bidimensionales, una clase de materiales prometedores para aplicaciones en electrónica y óptica, pero que son difíciles de caracterizar sin la ayuda de la IA. Sin embargo, observó que el método tiene un alcance mucho más amplio.

« El sueño es algún día tener un microscopio ‘autodirigido’, y la mayor barrera fue entender cómo procesar los datos », dijo. « Nuestro trabajo llena este vacío. Mostramos cómo puedes enseñarle a un microscopio cómo encontrar cosas interesantes sin tener que saber lo que estás buscando ».