Desde a descoberta há quase 100 anos do manuscrito Voynich, um livro de 240 páginas cheio de mensagens cifradas e ilustrações difíceis de entender, linguistas e criptógrafos têm tido dificuldade de compreender o conteúdo. Usando inteligência artificial, pesquisadores canadenses avançaram consideravelmente para decifrar os significados escondidos do documento.

Novo sistema de IA informa quando médicos devem tomar cuidados finais com pacientes
Inteligência artificial tem sido usada para criar vídeos pornô falsos de ex-parceiros

Batizado em homenagem a Wilfrid Voynich, polonês e revendedor de livros que obteve o manuscrito em 1912, o documento do século 15 foi escrito em símbolos desconhecidos que codificam uma linguagem desconhecida — uma dupla surpresa que até este ponto foi impossível de interpretar.

O manuscrito Voynich contém centenas de páginas frágeis, algumas faltando, com textos escritos à mão, da esquerda para a direita. A maioria das páginas contém ilustrações de diagramas, incluindo plantas, pessoas nuas e símbolos astronômicos. No que diz respeito ao significado dos textos, nada. Nenhuma pista do que está lá.

E não foi por falta de tentativa. O manuscrito é considerado um dos criptogramas mais importantes do mundo e tem passado pela mão de criptógrafos, tanto profissionais como amadores, por décadas.

Manuscrito Voynich (Imagem: Beinecke Rare Book & Manuscript Library, Yale University)

Ele foi até analisado por solucionadores de códigos da Segunda Guerra Mundial, porém eles também não tiveram sorte. Já foram criadas várias teorias sobre o código com o passar dos anos, incluindo uma que diz que o manuscrito foi criado usando esquemas de criptografia semirrandômicos, anagramas ou sistemas de escrita em que vogais foram removidas. Alguns sugerem que o documento é só uma zoeira bem elaborada.

Entendendo padrões com a inteligência artificial

Para Greg Kondrak, especialista em processamento de linguagem natural da Universidade de Alberta (Canadá), isso parece uma tarefa perfeita para inteligência artificial. Com a ajuda do estudante de pós-graduação Bradley Hauer, ele teve considerável avanço em quebrar o código, descobrindo que o texto parece ter sido escrito em língua hebraica e com letras ordenadas em um padrão fixo. Para ser justo, os pesquisadores ainda não sabem o significado do manuscrito Voynich, mas a atual descoberta é um ponto de partida interessante para outros especialistas se juntarem à investigação.

O primeiro passo foi entender a língua codificada no texto. Para isso, a inteligência artificial estudou o texto da “Declaração Universal de Direitos Humanos”, escrito em 380 línguas distintas, para procurar por padrões. Após esse treinamento, a inteligência artificial analisou a linguagem sem nexo do manuscrito, concluindo com alta probabilidade que o texto foi escrito numa língua hebraica codificada. Kondrak e Hauer ficaram surpresos, pois pensavam que o documento estivesse escrito em árabe.

“Foi uma surpresa”, disse Kondrak em um comunicado. “E dizer que foi escrito em hebraico é o primeiro passo. O próximo agora é decifrar.”

Trecho do texto do manuscrito Voynich (Imagem: Beinecke Rare Book & Manuscript Library, Yale University)

Para o próximo estágio, os pesquisadores se divertiram com a hipótese proposta por pesquisadores que os precederam — de que o manuscrito tenha sido feito com alfagramas, ou seja, palavras cujas letras originais são alteradas de ordem para ficarem irreconhecíveis (por exemplo, um alfagrama de GIZMODO seria DGIMOOZ). Sabendo que o texto foi escrito originalmente em hebraico, os pesquisadores desenvolveram um algoritmo que analisa esses anagramas e cria palavras no idioma.

“No fim das contas, 80% das palavras constavam no dicionário hebraico, mas não sabíamos se elas faziam algum sentido juntas”, disse Kondrak.

Por fim, os pesquisadores decifraram a frase inicial do manuscrito e apresentaram a Moshe Koppel, um cientista da computação que fala hebraico. Koppel disse que ela não forma uma sentença coerente em sua língua.

“No entanto, após alguns problemas de ortografia, o Google Tradutor conseguiu converter para um inglês um pouco esquisito: ‘Ela fez recomendações ao sacerdote, homem da casa e eu e pessoas’”, escreveram os pesquisadores no estudo que pode ser visto na Transactions of the Association of Computational Linguistics.

É muito estranha a forma como o manuscrito de 240 páginas é iniciado, mas pelo menos a sentença faz algum sentido.

É importante ressaltar que os pesquisadores não estão dizendo que decifraram todo o manuscrito. Na verdade, eles identificaram a origem da linguagem (no caso, hebraica) e o esquema de codificação no qual as letras foram ordenadas de uma forma particular (no caso, alfagrama). Kondrak disse que o significado completo do texto não será conhecido até historiadores com conhecimento em hebraico antigo começarem a analisar o texto.

A equipe agora planeja aplicar o novo algoritmo em outros manuscritos antigos, destacando o potencial da inteligência artificial para resolver problemas que têm intrigado os humanos por séculos.

[Transactions of the Association of Computational Linguistics]

Foto do topo: um trecho do manuscrito Voynich. (Imagem: Beinecke Rare Book & Manuscript Library, Yale University)