Duas décadas depois que o rascunho da sequência do genoma humano foi revelado com grande alarde, uma equipe de 99 cientistas finalmente decifrou a coisa toda. Eles preencheram grandes lacunas e corrigiram uma longa lista de erros em versões anteriores, dando-nos uma nova visão de nosso DNA.
O consórcio postou seis papéis online nas últimas semanas, nas quais eles descrevem o genoma completo. Esses dados muito procurados, agora em revisão por periódicos científicos, darão aos cientistas uma compreensão mais profunda de como o DNA influencia os riscos de doenças, dizem os cientistas, e como as células o mantêm em cromossomos bem organizados em vez de emaranhados moleculares.
Por exemplo, os pesquisadores descobriram mais de 100 novos genes que podem ser funcionais e identificaram milhões de variações genéticas entre as pessoas. Algumas dessas diferenças provavelmente desempenham um papel nas doenças.
Para Nicolas Altemose, um pesquisador de pós-doutorado na Universidade da Califórnia, Berkeley, que trabalhou na equipe, a visão do genoma humano completo se parece com as fotos em close de Plutão da sonda espacial New Horizons.
“Você podia ver cada cratera, você podia ver todas as cores, de algo que só tínhamos uma compreensão mais borrada antes”, disse ele. “Este foi apenas um sonho absoluto que se tornou realidade.”
Especialistas que não estiveram envolvidos no projeto disseram que ele permitirá que os cientistas explorem o genoma humano com muito mais detalhes. Grandes pedaços do genoma que estavam simplesmente em branco agora são decifrados com tanta clareza que os cientistas podem começar a estudá-los seriamente.
“O fruto desse esforço de sequenciamento é incrível”, disse Yukiko Yamashita, bióloga do desenvolvimento do Instituto Whitehead para Pesquisa Biomédica do Instituto de Tecnologia de Massachusetts.
Um século atrás, os cientistas sabiam que os genes estavam espalhados por 23 pares de cromossomos, mas essas estranhas estruturas microscópicas semelhantes a vermes permaneceram em grande parte um mistério.
No final da década de 1970, os cientistas ganharam a capacidade de localizar alguns genes humanos individuais e decodificar sua sequência. Mas suas ferramentas eram tão rudimentares que caçar um único gene poderia ocupar uma carreira inteira.
No final do século 20, uma rede internacional de geneticistas decidiu tentar sequenciar todo o DNA de nossos cromossomos. O Projeto Genoma Humano foi um empreendimento audacioso, dado o quanto havia para sequenciar. Os cientistas sabiam que as fitas gêmeas de DNA em nossas células continham cerca de três bilhões de pares de letras – um texto longo o suficiente para preencher centenas de livros.
Quando essa equipe começou seu trabalho, a melhor tecnologia dos cientistas poderia usar pedaços sequenciados de DNA com apenas algumas dezenas de letras, ou bases, de comprimento. Os pesquisadores tiveram que colocá-los juntos como as peças de um vasto quebra-cabeça. Para montar o quebra-cabeça, eles procuraram fragmentos com extremidades idênticas, o que significa que vieram de porções sobrepostas do genoma. Levou anos para eles juntarem gradualmente os fragmentos sequenciados em faixas maiores.
A Casa Branca anunciou em 2000 que os cientistas haviam concluído o primeiro esboço do genoma humano, e os detalhes do projeto foram publicados no ano seguinte. Mas longos trechos do genoma permaneceram desconhecidos, enquanto os cientistas lutavam para descobrir a que milhões de outras bases pertenciam.
Descobriu-se que o genoma era um quebra-cabeça muito difícil de montar a partir de pequenos pedaços. Muitos de nossos genes existem como múltiplas cópias quase idênticas entre si. Às vezes, as diferentes cópias executam trabalhos diferentes. Outras cópias – conhecidas como pseudogenes – são desativadas por mutações. Um pequeno fragmento de DNA de um gene pode se encaixar tão bem nos outros.
E os genes representam apenas uma pequena porcentagem do genoma. O resto pode ser ainda mais desconcertante. Grande parte do genoma é composto de trechos de DNA semelhantes a vírus que existem em grande parte apenas para fazer novas cópias de si mesmos, que são inseridas de volta no genoma.
No início dos anos 2000, os cientistas ficaram um pouco melhores em montar o quebra-cabeça do genoma a partir de suas pequenas peças. Eles fizeram mais fragmentos, os leram com mais precisão e desenvolveram novos programas de computador para montá-los em pedaços maiores do genoma.
Periodicamente, os pesquisadores revelavam o melhor e mais recente esboço do genoma humano – conhecido como genoma de referência. Os cientistas usaram o genoma de referência como um guia para seus próprios esforços de sequenciamento. Por exemplo, os geneticistas clínicos catalogariam as mutações causadoras de doenças comparando genes de pacientes com o genoma de referência.
O mais novo genoma de referência foi lançado em 2013. Era muito melhor do que o primeiro rascunho, mas estava muito longe de ser concluído. Oito por cento estava simplesmente em branco.
“Há basicamente um cromossomo humano inteiro que desapareceu”, disse Michael Schatz, biólogo computacional da Universidade Johns Hopkins.
Em 2019, dois cientistas – Adam Phillippy, biólogo computacional do National Human Genome Research Institute, e Karen Miga, geneticista da University of California, Santa Cruz – fundaram o Consórcio Telomere-to-Telomere para completar o genoma.
O Dr. Phillippy admitiu que parte de sua motivação para um projeto tão audacioso era que as lacunas que faltavam o incomodavam. “Eles estavam realmente me incomodando”, disse ele. “Você pega um belo quebra-cabeça de paisagem, retira uma centena de peças e olha para ele – isso é muito incômodo para um perfeccionista.”
O Dr. Phillippy e o Dr. Miga pediram aos cientistas que se juntassem a eles para terminar o quebra-cabeça. Eles acabaram com 99 cientistas trabalhando diretamente no sequenciamento do genoma humano e dezenas de outros contribuindo para dar sentido aos dados. Os pesquisadores trabalharam remotamente durante a pandemia, coordenando seus esforços no Slack, um aplicativo de mensagens.
“Era uma colônia de formigas surpreendentemente boa”, disse Miga.
O consórcio aproveitou as novas máquinas que podem ler trechos de DNA que alcançam dezenas de milhares de bases. Os pesquisadores também inventaram técnicas para descobrir onde as sequências de repetição particularmente misteriosas pertenciam a um genoma.
Ao todo, os cientistas adicionaram ou fixaram mais de 200 milhões de pares de bases no genoma de referência. Eles agora podem dizer com confiança que o genoma humano mede 3,05 bilhões de pares de bases de comprimento.
Dentro dessas novas sequências de DNA, os cientistas descobriram mais de 2.000 novos genes. A maioria parece ser desativada por mutações, mas 115 deles parecem poder produzir proteínas – cuja função os cientistas podem levar anos para descobrir. O consórcio agora estima que o genoma humano contém 19.969 genes codificadores de proteínas.
Com um genoma completo finalmente montado, os pesquisadores puderam observar melhor a variação do DNA de uma pessoa para outra. Eles descobriram mais de dois milhões de novos pontos no genoma onde as pessoas diferem. Usar o novo genoma também os ajudou a evitar a identificação de mutações ligadas a doenças onde não existem de fato.
“É um grande avanço para o campo”, disse o Dr. Midhat Farooqui, diretor de oncologia molecular do Children’s Mercy, um hospital em Kansas City, Missouri, que não esteve envolvido no projeto.
O Dr. Farooqi começou a usar o genoma para sua pesquisa em doenças infantis raras, alinhando o DNA de seus pacientes com as lacunas recentemente preenchidas para pesquisar mutações.
Mudar para o novo genoma pode ser um desafio para muitos laboratórios clínicos, no entanto. Eles terão que transferir todas as suas informações sobre as ligações entre genes e doenças para um novo mapa do genoma. “Haverá um grande esforço, mas levará alguns anos”, disse a Dra. Sharon Plon, geneticista médica do Baylor College of Medicine em Houston.
Dr. Altemose planeja usar o genoma completo para explorar uma região particularmente misteriosa em cada cromossomo conhecido como centrômero. Em vez de armazenar genes, os centrômeros ancoram proteínas que movem os cromossomos em torno de uma célula à medida que ela se divide. A região do centrômero contém milhares de segmentos repetidos de DNA.
Em sua primeira análise, o Dr. Altemose e seus colegas ficaram impressionados com a forma como as diferentes regiões do centrômero podem ser de uma pessoa para outra. Essa observação sugere que os centrômeros têm evoluído rapidamente, à medida que as mutações inserem novos pedaços de DNA repetido nas regiões ou cortam outros pedaços.
Embora parte desse DNA repetitivo possa desempenhar um papel na separação dos cromossomos, os pesquisadores também encontraram novos segmentos – alguns deles com milhões de bases de comprimento – que não parecem estar envolvidos. “Não sabemos o que eles estão fazendo”, disse Altemose.
Mas agora que as zonas vazias do genoma foram preenchidas, Altemose e seus colegas podem estudá-las de perto. “Estou muito animado para ver todas as coisas que podemos descobrir”, disse ele.
Discussão sobre isso post