¿Por qué algunas personas participan en estudios genéticos y otras no? La respuesta puede estar dentro de nuestra composición genética. Según un estudio innovador del Leverhulme Center for Demographic Science and Big Data Institute de Oxford, las personas que participan en estudios genéticos son genéticamente más propensas a hacerlo, dejando « huellas » detectables en los datos genéticos. Este avance brinda a los investigadores la capacidad de identificar y abordar el sesgo de participación, un desafío importante en la investigación genética.

Stefania Benonisdottir, autora principal del estudio y candidata a doctorado del Big Data Institute de Oxford, explica: « Actualmente, la mayoría de los estudios genéticos se basan en bases de datos genéticas que contienen un gran número de participantes y una gran cantidad de información ». Sin embargo, es más probable que algunas personas se incluyan en estas bases de datos que otras, lo que puede crear un problema llamado sesgo de determinación, en el que los datos genéticos recopilados no son representativos de la población prevista para el estudio.

Para estudiar este vínculo entre los datos genéticos y el sesgo de participación, los investigadores recurrieron a una de las bases de datos biomédicas más grandes del mundo, el Biobanco del Reino Unido, que contiene información de medio millón de participantes.

Usando datos del Biobanco del Reino Unido, se descubrió que hay un componente genético en la probabilidad de que las personas participen, que está correlacionado pero es distinto de otros rasgos humanos. Publicado hoy en Nature Genetics, el estudio destaca que la participación podría ser un rasgo humano importante que se ha subestimado anteriormente e introduce un marco estadístico que podría conducir a análisis más precisos de los datos genéticos.

El profesor Augustine Kong, autor principal del Leverhulme Center for Demographic Science and the Big Data Institute, señala: « El sesgo de determinación plantea un desafío estadístico en la investigación genética, especialmente en la era de los grandes datos. Los ajustes para este sesgo a menudo se basan en diferencias conocidas entre participantes y no participantes, lo que introduce imperfecciones al responder preguntas que involucran variables que solo se observan para los participantes, como los genotipos. Nuestro estudio identifica huellas detectables de sesgo de participación en los datos genéticos de los participantes, que pueden explotarse estadísticamente para mejorar la precisión de la investigación tanto para los participantes como para los no participantes”.

Los estudios de asociación del genoma completo ofrecen información importante sobre el papel de la genética en la salud y las enfermedades humanas. Sin embargo, tales estudios pueden verse afectados por sesgos, que surgen cuando las bases de datos genéticas no son representativas de la población de estudio prevista. Ahora, la inclinación genética identificada a participar puede ayudar a los científicos a evaluar la representatividad de su muestra de estudio.

Al analizar los datos genéticos de más de 30 000 participantes relacionados con ascendencia británica blanca del Biobanco del Reino Unido, los investigadores encontraron que el componente genético que subyace a la participación en el estudio se correlaciona con los componentes genéticos de rasgos como el logro educativo y el cuerpo, pero es distinto de ellos. índice de masa.

Por ejemplo, la correlación estimada entre los componentes genéticos que subyacen a la participación en el Biobanco del Reino Unido y el nivel educativo se estima en un 36,6 %. Este resultado es consistente con algunas de las diferencias previamente reportadas entre los participantes y los no participantes, pero también muestra que el sesgo de participación no está completamente capturado por estas diferencias previamente conocidas. En otras palabras, la participación no es simplemente una consecuencia de estos otros rasgos y características.

El estudio también encontró que el componente genético de la participación puede transmitirse de padres a hijos y puede afectar la participación de las personas en muchos estudios diferentes a lo largo de sus vidas. Esto destaca el potencial de sesgo en la investigación genética y subraya la importancia de tener en cuenta tales sesgos en el diseño y análisis del estudio.

La profesora Melinda Mills, directora del Leverhulme Center for Demographic Science concluye: ‘Como muestra nuestro Monitor de diversidad GWAS, el camino para mejorar la diversidad en los estudios de asociación del genoma es largo. Sin embargo, este marco estadístico es un gran paso en la dirección correcta para mitigar el riesgo de análisis de datos incompletos o inexactos y garantizar que la investigación genética realmente beneficie a todos”.