O alfagenoma de DeepMind visa decodificar ‘matéria escura’ do DNA
Esse sistema de IA pode analisar até um milhão de cartas de DNA de uma só vez, prevendo como pequenas mudanças nas regiões não codificadoras acionam tudo, desde o câncer a distúrbios genéticos raros – e potencialmente revolucionando medicamentos personalizados

O quebra-cabeça parece impossível: pegue um código de três bilhões de letras e preveja o que acontece se você trocar uma única letra. O código de que estamos falando – o genoma humano – ocupa a maioria de suas instruções em “matéria escura” genética, os 98 % do DNA que não produzem proteínas. O Alfagenoma, um sistema de inteligência artificial lançado pelo Google DeepMind em Londres, pretende mostrar como até pequenas mudanças nessas seções que não codificam afetam a expressão gênica.
A tecnologia recém -lançada da DeepMind pode transformar como tratamos doenças genéticas. Embora os cientistas demitissem há muito tempo o DNA não codificante como “lixo”, agora sabemos que isso é chamado de matéria escura quando e como os genes ligam ou desligam. O alfagenoma mostra promessa ao prever como as mutações nessas regiões causam doenças – desde certos tipos de câncer a distúrbios raros onde as proteínas cruciais nunca são feitas. Ao revelar esses interruptores de controle ocultos, o alfagenoma pode ajudar os pesquisadores a projetar terapias que visam condições genéticas, potencialmente ajudando milhões de pessoas.
Mas, para entender a complexidade da tarefa para a qual o alfagenoma foi criado, é preciso considerar como a definição de um “gene” evoluiu. O termo, cunhado em 1909 para descrever unidades invisíveis de hereditariedade (como proposto por Gregor Mendel em 1865) inicialmente não carregava bagagem molecular. Mas na década de 1940, a idéia de “um gene, uma enzima” tomou conta. E na década de 1960, os livros didáticos ensinaram que, para que um trecho de DNA fosse chamado adequadamente de gene, ele tinha que codificar uma proteína específica.
Sobre apoiar o jornalismo científico
Se você está gostando deste artigo, considere apoiar nosso jornalismo premiado por assinando. Ao comprar uma assinatura, você está ajudando a garantir o futuro das histórias impactantes sobre as descobertas e idéias que moldam nosso mundo hoje.
Nas últimas duas décadas, a definição aumentou com as descobertas de genes que codificam os numerosos tipos de RNAs que não Seja traduzido em proteínas. Hoje, um gene é considerado qualquer segmento de DNA cujo produto de RNA ou proteína desempenha uma função biológica. Essa mudança conceitual ressalta o mapa imobiliário do genoma: apenas cerca de 1 a 2 % do DNA humano codifica diretamente as proteínas. Mas com a definição mais ampla, aproximadamente 40 % é um território genético.
O que permanece não contabilizado é significativo: mais de um bilhão de unidades de código que podem determinar como e com que frequência os genes são ativados. Como as pistas relevantes estão distantes e se desenrolam através de ciclos complexos de regulação de genes, a decodificá -los está entre os desafios mais difíceis da biologia. O objetivo do alfagenoma é entender como essas regiões afetam a expressão gênica – e como até pequenas mudanças podem inclinar o equilíbrio de todo o corpo entre saúde e doença. Para isso, o sistema de IA usa uma sequência de DNA com um comprimento de até um milhão de letras como entrada – e “prediz milhares de propriedades moleculares que caracterizam sua atividade regulatória”, de acordo com um comunicado emitido pela DeepMind.
O alfagenoma já replicou os resultados dos laboratórios de genética. Em um estudo de pré-impressão de junho de 2025 (que ainda não foi revisado por pares), a equipe do alfagenoma descreveu usando o modelo para executar uma simulação que espelhava interações conhecidas de DNA: mutações que agem como interruptores desonestos, acionando um gene em excesso em um certo tipo de leucemia. Quando o alfagenoma simulado interações em um trecho de DNA contendo o gene e a mutação, ele previu a mesma cadeia complexa de eventos que já foram observados em experimentos de laboratório.
Embora o alfagenoma esteja atualmente disponível apenas para testes não comerciais, as respostas na comunidade científica estão entusiasmadas até agora, com as startups de biotecnologia e os pesquisadores universitários expressando emoção publicamente sobre o potencial do sistema de acelerar a pesquisa.
Os limites permanecem. O alfagenoma luta para capturar interações que estão a mais de 100.000 cartas de DNA de distância, podem perder algumas nuances específicas de tecido e não foram projetadas para prever características de um genoma pessoal completo. Doenças complexas que dependem do desenvolvimento ou ambiente também estão fora de seu escopo direto. O sistema sugere usos abrangentes, no entanto: rastreando como as alterações de minúscula se movem através da regulação de genes, ele pode identificar as raízes dos distúrbios genéticos. Pode ajudar no design do DNA sintético. E acima de tudo, poderia oferecer uma maneira mais rápida de traçar os complexos circuitos regulatórios do genoma.