Las poblaciones sintéticas son grupos de personas generados por computadora que están diseñados para parecerse a poblaciones reales. Se construyen utilizando información del censo público sobre las características de las personas, como su edad, género y trabajo, junto con algoritmos estadísticos que ayudan a ponerlo todo junto. Su principal aplicación es la realización de las llamadas simulaciones sociales para evaluar diferentes soluciones posibles a problemas sociales, como el transporte, los problemas de salud y la vivienda. Durante la pandemia de COVID-19, por ejemplo, científicos en muchos lugares del mundo realizaron simulaciones sociales para estimar la cantidad de casos en cada país.

En Japón, los investigadores han estado realizando este tipo de simulaciones utilizando supercomputadoras en el marco del Proyecto de Simulación e IA de COVID-19 dirigido por la Secretaría del Gabinete del gobierno japonés desde 2020. Se les dio una consideración importante al decidir diversas medidas políticas, como las políticas de prueba de PCR, límites de inmigración, apoyo al turismo interno, programas de vacunación, etc. Estas simulaciones fueron posibles gracias a una población sintética que se preparó y actualizó en el marco del proyecto del Centro de investigación/uso conjunto para infraestructuras de información interdisciplinarias a gran escala (JHPCN), desde 2017.

Sin embargo, esta población sintética japonesa tenía una limitación significativa : aunque la dirección de su casa era uno de los atributos asignados a cada individuo, la ubicación de su lugar de trabajo no lo era. Como resultado, esta población sintética fue más precisa para representar la distribución nocturna de personas, pero no su distribución diurna, o la relación entre ambas.

Para abordar este problema, un trío de investigadores japoneses, incluido el Profesor Asistente Takuya Harada del Instituto de Tecnología de Shibaura, así como el Dr. Tadahiko Murata y el Sr. Daiki Iwase de la Facultad de Informática de la Universidad de Kansai, recientemente idearon un método para asignar un lugar de trabajo atribuir a cada trabajador en poblaciones sintéticas. Su estudio fue publicado en IEEE Transactions on Computational Social Systems y fue apoyado tanto por JHPCN como por la Agencia de Ciencia y Tecnología de Japón (JST).

El principal desafío que tuvieron que superar los investigadores fue la falta de información estadística que vinculara las ubicaciones de las casas y los lugares de trabajo de las personas. En Japón, solo los gobiernos locales cuya área tiene más de 200 000 residentes publican estadísticas completas de origen-destino-industria (ODI), que brindan detalles sobre el movimiento de trabajadores, así como su tipo de industria (como venta minorista, construcción o manufactura). Para ciudades, pueblos o aldeas con menos de 200.000 habitantes, los datos ODI disponibles son menos específicos y solo indican si la persona trabaja en la misma ciudad, en otra ciudad dentro de la misma prefectura o en otra ciudad en una prefectura diferente. Desafortunadamente, aproximadamente el 48 % de los trabajadores en Japón residen en ciudades con menos de 200 000 habitantes.

Por lo tanto, el equipo de investigación combinó los datos ODI disponibles con los datos de origen y destino (OD) y desarrolló un método innovador de asignación de lugares de trabajo que funciona para todas las ciudades, pueblos y aldeas de Japón. Para probar si su método se diseñó correctamente, lo usaron para asignar lugares de trabajo a personas en ciudades con más de 200 000 habitantes y compararon los resultados con los datos ODI completos disponibles. Para la ciudad de Takatsuki en la prefectura de Osaka, que los investigadores mostraron como ejemplo en su artículo, el método propuesto podría asignar las ciudades correctas como lugares de trabajo para el 88,2 % de los trabajadores.

Las posibles aplicaciones de las simulaciones sociales detalladas que utilizan poblaciones sintéticas son múltiples, como señala el profesor Murata de la Universidad de Kansai : « Las simulaciones sociales a escala real se pueden utilizar para estimar la eficiencia de los desarrollos urbanos, incluidos los proyectos de vivienda y transporte, así como la influencia de programas sociales llevados a cabo por gobiernos nacionales o locales. También pueden emplearse para programas de rescate y socorro cuando se enfrentan desastres como terremotos, tsunamis, inundaciones, tifones y pandemias ». En pocas palabras, las simulaciones sociales pueden ayudar a los tomadores de decisiones a imaginar con precisión varios futuros posibles.

Otro aspecto importante de las poblaciones sintéticas es que están libres de problemas de privacidad de datos. « Las poblaciones sintéticas son una tecnología segura porque no se utiliza información privada », explica el profesor asistente Harada, « debido a que sintetizamos múltiples conjuntos de poblaciones que tienen las mismas características estadísticas, los terceros no pueden identificar si se incluye información real o no ». Vale la pena señalar que este estudio marca las primeras poblaciones sintéticas del mundo con información sobre el lugar de trabajo que se publica públicamente para ingenieros e investigadores.

El equipo de investigación ya está trabajando en el uso de su nuevo método de asignación de lugares de trabajo para estimar la distribución de la población durante el día en todo Japón.