Gran parte del genoma humano está formado por regiones reguladoras que controlan qué genes se expresan en un momento dado dentro de una célula. Esos elementos reguladores pueden ubicarse cerca de un gen objetivo o hasta 2 millones de pares de bases lejos del objetivo.
Para permitir esas interacciones, el genoma se enlaza a sí mismo en una estructura 3D que acerca regiones distantes. Usando una nueva técnica, los investigadores del MIT han demostrado que pueden mapear estas interacciones con una resolución 100 veces mayor de lo que era posible anteriormente.
« Usando este método, generamos los mapas de mayor resolución del genoma 3D que jamás se hayan generado, y lo que vemos son muchas interacciones entre potenciadores y promotores que no se habían visto antes », dice Anders Sejr Hansen, el Underwood-Prescott Career Development Profesor Asistente de Ingeniería Biológica en el MIT y autor principal del estudio. « Estamos emocionados de poder revelar una nueva capa de estructura 3D con nuestra alta resolución ».
Los hallazgos de los investigadores sugieren que muchos genes interactúan con docenas de elementos reguladores diferentes, aunque se necesitan más estudios para determinar cuáles de esas interacciones son las más importantes para la regulación de un gen determinado.
« Los investigadores ahora pueden estudiar de forma asequible las interacciones entre los genes y sus reguladores, lo que abre un mundo de posibilidades no solo para nosotros, sino también para docenas de laboratorios que ya han expresado interés en nuestro método », dice Viraat Goel, estudiante de posgrado del MIT y uno de los los autores principales del artículo. « Estamos entusiasmados de brindarle a la comunidad investigadora una herramienta que los ayude a desentrañar los mecanismos que impulsan la regulación genética ».
El postdoctorado del MIT, Miles Huseyin, también es autor principal del artículo, que aparece hoy en Nature Genetics.
Mapeo de alta resolución
Los científicos estiman que más de la mitad del genoma consta de elementos reguladores que controlan los genes, que representan solo alrededor del 2 por ciento del genoma. Los estudios de asociación de todo el genoma, que vinculan las variantes genéticas con enfermedades específicas, han identificado muchas variantes que aparecen en estas regiones reguladoras. Determinar con qué genes interactúan estos elementos reguladores podría ayudar a los investigadores a comprender cómo surgen esas enfermedades y, potencialmente, cómo tratarlas.
Descubrir esas interacciones requiere mapear qué partes del genoma interactúan entre sí cuando los cromosomas se empaquetan en el núcleo. Los cromosomas están organizados en unidades estructurales llamadas nucleosomas, hebras de ADN estrechamente enrolladas alrededor de las proteínas, lo que ayuda a que los cromosomas encajen dentro de los pequeños confines del núcleo.
Hace más de una década, un equipo que incluía a investigadores del MIT desarrolló un método llamado Hi-C, que reveló que el genoma está organizado como un « glóbulo fractal », lo que permite que la célula empaquete firmemente su ADN evitando los nudos. Esta arquitectura también permite que el ADN se despliegue y replique fácilmente cuando sea necesario.
Para realizar Hi-C, los investigadores usan enzimas de restricción para cortar el genoma en muchos pedazos pequeños y unir bioquímicamente los pedazos que están cerca uno del otro en el espacio 3D dentro del núcleo de la célula. Luego determinan las identidades de las piezas que interactúan al amplificarlas y secuenciarlas.
Si bien Hi-C revela mucho sobre la organización 3D general del genoma, tiene una resolución limitada para identificar interacciones específicas entre genes y elementos reguladores, como los potenciadores. Los potenciadores son secuencias cortas de ADN que pueden ayudar a activar la transcripción de un gen al unirse al promotor del gen, el sitio donde comienza la transcripción.
Para lograr la resolución necesaria para encontrar estas interacciones, el equipo del MIT se basó en una tecnología más reciente llamada Micro-C, que fue inventada por investigadores de la Facultad de Medicina de la Universidad de Massachusetts, dirigidos por Stanley Hsieh y Oliver Rando. Micro-C se aplicó por primera vez en la levadura en ciernes en 2015 y posteriormente se aplicó a células de mamíferos en tres artículos en 2019 y 2020 por investigadores como Hansen, Hsieh, Rando y otros en la Universidad de California en Berkeley y en la Facultad de Medicina de UMass.
Micro-C logra una resolución más alta que Hi-C mediante el uso de una enzima conocida como nucleasa microcócica para cortar el genoma. Las enzimas de restricción de Hi-C cortan el genoma solo en secuencias de ADN específicas que se distribuyen aleatoriamente, lo que da como resultado fragmentos de ADN de tamaños diferentes y más grandes. Por el contrario, la nucleasa microcócica corta uniformemente el genoma en fragmentos del tamaño de un nucleosoma, cada uno de los cuales contiene de 150 a 200 pares de bases de ADN. Esta uniformidad de pequeños fragmentos otorga a Micro-C su resolución superior sobre Hi-C.
Sin embargo, dado que Micro-C examina todo el genoma, este enfoque aún no logra una resolución lo suficientemente alta como para identificar los tipos de interacciones que los investigadores querían ver. Por ejemplo, si desea observar cómo interactúan entre sí 100 sitios del genoma diferentes, debe secuenciar al menos 100 multiplicados por 100 veces, o 10 000. El genoma humano es muy grande y contiene alrededor de 22 millones de sitios con resolución de nucleosoma. Por lo tanto, el mapeo Micro-C de todo el genoma humano requeriría al menos 22 millones multiplicados por 22 millones de lecturas de secuenciación, con un costo de más de mil millones de dólares.
Para reducir ese costo, el equipo ideó una forma de realizar una secuenciación más específica de las interacciones del genoma, lo que les permitió concentrarse en los segmentos del genoma que contienen genes de interés. Al centrarse en regiones que abarcan unos pocos millones de pares de bases, la cantidad de posibles sitios genómicos se reduce mil veces y los costos de secuenciación se reducen un millón, hasta aproximadamente $1000. Por lo tanto, el nuevo método, llamado Region Capture Micro-C (RCMC), es capaz de generar mapas 100 veces más ricos en información que otras técnicas publicadas por una fracción del costo.
« Ahora tenemos un método para obtener mapas de la estructura del genoma en 3D de ultra alta resolución de una manera muy asequible. Anteriormente, era tan inaccesible desde el punto de vista financiero porque se necesitarían millones, si no miles de millones de dólares, para obtener una alta resolución », dice Hansen.. « La única limitación es que no puede obtener el genoma completo, por lo que necesita saber aproximadamente en qué región está interesado, pero puede obtener una resolución muy alta, muy asequible ».
Muchas interacciones
En este estudio, los investigadores se centraron en cinco regiones que varían en tamaño desde cientos de miles hasta aproximadamente 2 millones de pares de bases, que eligieron debido a las características interesantes reveladas por estudios anteriores. Estos incluyen un gen bien caracterizado llamado Sox2, que juega un papel clave en la formación de tejidos durante el desarrollo embrionario.
Después de capturar y secuenciar los segmentos de ADN de interés, los investigadores encontraron muchos potenciadores que interactúan con Sox2, así como interacciones entre genes cercanos y potenciadores que no se habían visto anteriormente. En otras regiones, especialmente aquellas llenas de genes y potenciadores, algunos genes interactuaron con otros 50 segmentos de ADN y, en promedio, cada sitio de interacción contactó con otros 25.
« La gente ha visto múltiples interacciones de un trozo de ADN antes, pero generalmente es del orden de dos o tres, por lo que ver tantos de ellos fue bastante significativo en términos de diferencia », dice Huseyin.
Sin embargo, la técnica de los investigadores no revela si todas esas interacciones ocurren simultáneamente o en diferentes momentos, o cuáles de esas interacciones son las más importantes.
Los investigadores también encontraron que el ADN parece enrollarse en « microcompartimentos » anidados que facilitan estas interacciones, pero no pudieron determinar cómo se forman los microcompartimentos. Los investigadores esperan que un mayor estudio de los mecanismos subyacentes pueda arrojar luz sobre la cuestión fundamental de cómo se regulan los genes.
« Aunque actualmente no somos conscientes de lo que puede estar causando estos microcompartimentos, y tenemos todas estas preguntas abiertas frente a nosotros, al menos tenemos una herramienta para hacer esas preguntas de manera realmente estricta », dice Goel.
Además de responder a esas preguntas, el equipo del MIT también planea trabajar con investigadores del Boston Children’s Hospital para aplicar este tipo de análisis a las regiones genómicas que se han relacionado con trastornos sanguíneos en estudios de asociación del genoma completo. También están colaborando con investigadores de la Escuela de Medicina de Harvard para estudiar variantes relacionadas con trastornos metabólicos.
La investigación fue financiada por la subvención de apoyo (básica) del Instituto Koch del Instituto Nacional del Cáncer, los Institutos Nacionales de Salud, la Fundación Nacional de Ciencias, un Premio del Comité de Apoyo a la Investigación Solomon Buchsbaum, el Fondo de Investigación Fronteriza del Instituto Koch, una beca NIH y una Beca EMBO.