Ir al contenido
_
_
_
_

Google logra predecir con su IA cómo una sola letra del genoma oscuro puede causar enfermedades

El modelo AlphaGenome de DeepMind ayuda a entender cómo gobierna nuestra biología el 98% del ADN, que una vez se consideró basura

Humanos y chimpancés comparten alrededor del 98% de su secuencia de ADN, pero nadie diría que son animales casi idénticos. Esto se explica porque pequeñas diferencias en regiones reguladoras ―a veces de una sola letra de los 3.000 millones que componen el genoma humano― pueden tener efectos desproporcionados sobre cuándo, dónde y cuánto se expresan los genes y producir los rasgos propios de una especie o conducir a la aparición de cáncer o problemas neurológicos.

La secuencia del genoma humano se completó en 2003 y proliferaron las noticias que hablaban de genes de la felicidad, de la homosexualidad o que producían determinada enfermedad. O que nos sugerían que solo un porcentaje ínfimo separaba a los humanos de otros animales. Se solía decir que un gen contenía las instrucciones para que la célula produjese una proteína, para reconstruir el tejido de la piel, por ejemplo, y que, cuando el proceso funcionaba mal, aparecían los problemas. Pero, pese a la abundancia de declaraciones rimbombantes, ya se sabía que la biología no era un proceso tan sencillo.

Además de las partes de ADN que contienen la información para producir los ladrillos de nuestro cuerpo, que son las proteínas, hay una gran parte del genoma, lo que erróneamente se bautizó como ADN basura, que no codifica proteínas, pero que influye en cómo se producen en esa parte del genoma que sí codifica.

Más del 98% de nuestras variantes genéticas son así y pueden cambiar el comportamiento del genoma por muchos mecanismos, y la misma variante pueden tener un efecto distinto en una célula del cerebro o en una muscular. Comprender la complejidad de estos efectos es imposible sin ordenadores, y los expertos en computación ya están ofreciendo herramientas para dar sentido a lo que puede parecer un guirigay inabarcable.

Este miércoles, Google DeepMind ha presentado, en un artículo publicado en la revista Nature, su modelo AlphaGenome, diseñado para interpretar el genoma humano y, en particular, las regiones no codificantes del ADN. “El proyecto del genoma humano nos dio el libro de la vida, pero leerlo siguió siendo un reto. Tenemos el texto, pero aún estamos descifrando la semántica”, ha dicho en una presentación de los resultados Pushmeet Kohli, vicepresidente de Ciencia de Google Deepmind y responsable del trabajo.

El ADN es una sopa de letras con efectos que pueden ser dramáticos. Se cree, por ejemplo, que la pérdida de un minúsculo fragmento de proteína producido por una receta de 24 letras químicas (GCAAGGACATATGGGCGAAGGAGA) puede alterar el desarrollo del cerebro y favorecer la aparición del autismo. De una forma simplificada, AlphaGenome funciona como un intérprete universal de esta sopa de letras del ADN. Se le da un fragmento de ADN enorme, de un millón de letras, y ofrece una predicción de sus funciones, letra a letra.

Puede predecir, entre otras cosas, cuánto se expresan los genes, cómo se organiza el ADN en el espacio tridimensional ―algo que también tiene relevancia para sus efectos― o como se hace el splicing, un sistema de empalme que junta secuencias de letras y permite que un mismo gen produzca distintas lecturas, y que está detrás de la capacidad de las células para producir distintas proteínas con diferentes funciones o que haya tantos seres vivos distintos. Interpretar todo sin el poder de la IA es casi imposible a gran escala.

Modelos anteriores podían predecir uno de estos fenómenos, pero no todos a la vez, y se enfrentaban a un dilema. Los que ofrecían una resolución letra por letra, solo podían analizar secuencias cortas, de unos 10.000 pares de letras. Esto hacía, por ejemplo, que no pudiesen ver la influencia de regiones reguladoras lejanas que actúan como interruptores genéticos a cientos de miles de letras de distancia del gen que controlan. Por otro lado, los modelos que podían procesar cientos de miles de bases no tenían la resolución necesaria para ver los efectos de letras individuales. Era como elegir entre mirar con un telescopio o con una lupa, pero AlphaGenome ha logrado que no sea necesario elegir.

El artículo también probó su capacidad en la comprensión de enfermedades. Un ejemplo es la leucemia linfoblástica tipo T. En esta dolencia, no hay mutaciones en el gen TAL1, pero este se activa de una forma brutal y desencadena el cáncer. Analizando una sola letra mutada en parte del genoma basura, lejos del gen, pudieron predecir cómo esa mutación encendería el gen tumoral. La tarea llevaría meses de experimentos en un laboratorio, pero AlphaGenome pudo simularlo y resolverlo en poco tiempo, algo que muestra su poder para revelar mecanismos patológicos ocultos.

Mafalda Dias, investigadora del Centro de Regulación Genómica de Barcelona y una de las creadoras del modelo de IA popEVE, considera que las capacidades combinadas para el detalle y el procesamiento de grandes cantidades de bases convierten a AlphaGenome en “un paso adelante muy excitante como continuación a algo que la comunidad científica lleva tiempo haciendo”. No obstante, advierte de que “estos modelos no tienen mucha capacidad de personalización”. “Los modelos son buenos para comprender qué pasa con la biología regulatoria, pero no son útiles para predecir si una variante entre personas distintas va a tener un impacto; tienen una utilidad clínica limitada”, añade Dias, que no ha participado en este trabajo.

Los modelos predicen el efecto molecular de una variante en abstracto, pero no pueden predecir la expresión génica específica de un individuo concreto. Eso depende de todo su contexto genómico y ambiental, que está fuera del alcance de los modelos. Su uso hoy es más de investigación básica que de diagnóstico directo.

Žiga Avsec, responsable del diseño del modelo, reconoce que no han resuelto “el problema de la predicción del efecto de las variantes”. “Creo que aún nos queda un camino muy largo por recorrer”, afirma. Aunque el modelo puede predecir cómo una variante genética puede afectar a procesos moleculares como la expresión de un gen, no puede predecir de forma fiable y completa las consecuencias que un cambio en una letra del ADN puede tener en la realidad, en una célula o un tejido y en la salud de una persona.

Aunque el modelo “no es perfecto, dado que la expresión génica se ve influida por factores ambientales complejos que el modelo no puede detectar, lograr el nivel de precisión demostrado, basado únicamente en reglas locales del ADN, es una hazaña técnica increíble”, ha dicho Robert Goldstone, director de Genómica en el Instituto Francis Crick de Londres, al portal Science Media Centre. Hay investigadores que ya ven el potencial de estos modelos para, por ejemplo, el diagnóstico de enfermedades raras, que ya no solo deberían buscar el riesgo en genes concretos.

Natasha Latysheva, coautora del estudio, explica que, de momento, sus creadores consideran AlphaGenome un instrumento para la ciencia básica: “Vemos AlphaGenome como una herramienta para comprender lo que hacen los elementos funcionales del genoma, algo que, esperamos, acelerará nuestra comprensión fundamental del código de la vida”. El modelo está disponible para que lo utilicen investigadores para uso no comercial.

Tu suscripción se está usando en otro dispositivo

¿Quieres añadir otro usuario a tu suscripción?

Si continúas leyendo en este dispositivo, no se podrá leer en el otro.

¿Por qué estás viendo esto?

Flecha

Tu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.

¿Tienes una suscripción de empresa? Accede aquí para contratar más cuentas.

En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.

Rellena tu nombre y apellido para comentarcompletar datos

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_