Genealogia é um hobby antigo que ganhou certo fôlego recentemente graças às novas tecnologias. Além de sótão e arquivos, os detetives da ascendência podem agora usar sites nos EUA como o ancestry.com e entrar em contato com pessoas que podem ser geneticamente relacionadas a elas. Para Yaniv Erlich, cientista da computação formado pela Universidade Columbia, nos EUA, essa riqueza de informações genealógicas era um tesouro de dados esperando para ser explorado.

•. Teste de ancestralidade ganha boa melhoria ao analisar dados de mais pessoas
•. Poderia um teste de DNA de fato prever seus traços físicos?

“Estava pensando sobre o assunto e percebi que é possível alavancar o trabalho duro de milhões de genealogistas que estavam interessados em saber mais sobre a história da família”, disse Erlich, que é também chefe científico de genealogia e DNA na empresa MyHeritage, em entrevista ao Gizmodo. “Você pode pegar todo este trabalho duro e terá um belo conjunto de dados sobre a humanidade para ser estudado.”

Na última quinta-feira (1º), as conclusões de Erlich sobre esse conjunto de dados apareceram no periódico Science, na forma de uma enorme árvore genealógica de 13 milhões de pessoas, mostrando a conexão conexão humana de 500 anos atrás — tudo isso reunido de milhões de perfis genealógicos disponibilizados online.

Erlich e seus colegas baixaram 86 milhões de perfis públicos do geni.com, um website colaborativo de genealogia do MyHeritage, e usaram teoria dos gráficos para limpar e organizar os dados.

Como resultado, conseguiram uma imagem que mostra como nós somos interconectados. De muitas pequenas árvores genealógicas de famílias pequenas, os perfis interconectados convergiram em uma árvore genealógica com 13 milhões de pessoas, abrangendo uma média de 11 gerações.

“É fenomenal”, disse Adam Rutherford, geneticista britânico e autor do livro “A Brief History of Everyone Who Ever Lived”, ao Gizmodo. “Isso era o que nós sempre esperávamos ver. Nós sabemos há anos sobre como somos próximos uns dos outros, primeiro usando teoria matemática e, depois, similaridade genética. Mas ter essa ideia de uma árvore genealógica real com milhões de pessoas é incrível.”

Migração, fertilidade e longevidade

E o que dá para aprender com essa árvore com 13 milhões de pessoas? Erlich disse que, especialmente quando combinada com outros dados, a informação pode ser uma ferramenta valiosa para estudar assuntos como migração, casamento, fertilidade e longevidade.

Na pesquisa, por exemplo, eles descobriram que entre 1800 e 1850, por alguma razão, as pessoas iam mais longe, quase 20 km, para encontrar um parceiro, o que era uma distância grande, se considerarmos os meios de transporte daquele tempo. Nessa época, eles também descobriram que era mais provável as pessoas se casarem com algum parente — entre 1650 e 1850, as pessoas se casavam com primos de, em média, quarto grau.

A questão da distância, segundo a hipótese considerada pelos especialistas, sugere que o eventual declínio de casamentos consanguíneos (entre parentes) teve mais relação com a mudança de normas sociais do que a habilidade de viajar mais longe para achar um companheiro. De acordo com o estudo, só nas décadas a partir de 1850 é que houve redução no casamento entre primos.

Outro recorte dos dados analisados revelou que os genes explicam apenas 16% das variações de longevidade vistas nos dados, e que genes de longevidade só podem estender a vida de uma pessoa em média por cinco anos. Erlich disse que isso sugere que escolhas de estilo de vida têm muito mais peso que os genes que recebemos ao determinar quanto tempo iremos viver.

O conjunto de dados anonimizado está disponível para pesquisadores acadêmicos no FamiLinx.org, um site criado por Erlich e seus colegas. No entanto, os dados têm limites. Por exemplo, 85% dos perfis são da Europa e da América do Norte.

“A genealogia é um dos hobbies mais populares do mundo, e o que eles fizeram aqui foi transformar isso em um recurso científico que será analisado por décadas”, disse Rutherford, que não esteve envolvido no estudo. “É impressionante.”

Vídeo preparado pela equipe de Erlich mostra evolução parcial da população do mundo entre 1.400 e 1.900

As árvores genealógicas do geni.com são povoadas tanto por informações obtidas de forma antiga — fotografias e registros — como por testes de DNA, estes mais recentes. Embora determinar quão irlandês ou inglês alguém seja baseado no DNA ainda não seja 100% preciso, a ciência que “mostra sua origem” é muito mais exata. Os testes de DNA podem achar correspondência entre nós e nossos familiares mais próximos com baixíssima margem de erro. O erro mais comum ao relacionar DNA com parentes está nas gerações — geralmente, confundindo um primo de segundo grau por um de terceiro.

Erlich reconhece que pode haver erros nos dados baseados nas informações que as pessoas forneceram. No entanto, por ser colaborativo, como a Wikipédia, diz ele, eventualmente os erros podem ser corrigidos.

“Acho que a coisa mais bonita deste trabalho é como ele pode alavancar o trabalho de tantos genealogistas”, disse Erlich. “E extrair algum conhecimento sobre a humanidade.”