
Inteligência artificial tem ajudado a entender manuscrito indecifrável de mais de 500 anos

Desde a descoberta há quase 100 anos do manuscrito Voynich, um livro de 240 páginas cheio de mensagens cifradas e ilustrações difíceis de entender, linguistas e criptógrafos têm tido dificuldade de compreender o conteúdo. Usando inteligência artificial, pesquisadores canadenses avançaram consideravelmente para decifrar os significados escondidos do documento.
• Novo sistema de IA informa quando médicos devem tomar cuidados finais com pacientes
• Inteligência artificial tem sido usada para criar vídeos pornô falsos de ex-parceiros
Batizado em homenagem a Wilfrid Voynich, polonês e revendedor de livros que obteve o manuscrito em 1912, o documento do século 15 foi escrito em símbolos desconhecidos que codificam uma linguagem desconhecida — uma dupla surpresa que até este ponto foi impossível de interpretar.
O manuscrito Voynich contém centenas de páginas frágeis, algumas faltando, com textos escritos à mão, da esquerda para a direita. A maioria das páginas contém ilustrações de diagramas, incluindo plantas, pessoas nuas e símbolos astronômicos. No que diz respeito ao significado dos textos, nada. Nenhuma pista do que está lá.
E não foi por falta de tentativa. O manuscrito é considerado um dos criptogramas mais importantes do mundo e tem passado pela mão de criptógrafos, tanto profissionais como amadores, por décadas.
Manuscrito Voynich (Imagem: Beinecke Rare Book & Manuscript Library, Yale University)
Ele foi até analisado por solucionadores de códigos da Segunda Guerra Mundial, porém eles também não tiveram sorte. Já foram criadas várias teorias sobre o código com o passar dos anos, incluindo uma que diz que o manuscrito foi criado usando esquemas de criptografia semirrandômicos, anagramas ou sistemas de escrita em que vogais foram removidas. Alguns sugerem que o documento é só uma zoeira bem elaborada.
Entendendo padrões com a inteligência artificial
Para Greg Kondrak, especialista em processamento de linguagem natural da Universidade de Alberta (Canadá), isso parece uma tarefa perfeita para inteligência artificial. Com a ajuda do estudante de pós-graduação Bradley Hauer, ele teve considerável avanço em quebrar o código, descobrindo que o texto parece ter sido escrito em língua hebraica e com letras ordenadas em um padrão fixo. Para ser justo, os pesquisadores ainda não sabem o significado do manuscrito Voynich, mas a atual descoberta é um ponto de partida interessante para outros especialistas se juntarem à investigação.
O primeiro passo foi entender a língua codificada no texto. Para isso, a inteligência artificial estudou o texto da “Declaração Universal de Direitos Humanos”, escrito em 380 línguas distintas, para procurar por padrões. Após esse treinamento, a inteligência artificial analisou a linguagem sem nexo do manuscrito, concluindo com alta probabilidade que o texto foi escrito numa língua hebraica codificada. Kondrak e Hauer ficaram surpresos, pois pensavam que o documento estivesse escrito em árabe.
“Foi uma surpresa”, disse Kondrak em um comunicado. “E dizer que foi escrito em hebraico é o primeiro passo. O próximo agora é decifrar.”
Trecho do texto do manuscrito Voynich (Imagem: Beinecke Rare Book & Manuscript Library, Yale University)
Para o próximo estágio, os pesquisadores se divertiram com a hipótese proposta por pesquisadores que os precederam — de que o manuscrito tenha sido feito com alfagramas, ou seja, palavras cujas letras originais são alteradas de ordem para ficarem irreconhecíveis (por exemplo, um alfagrama de GIZMODO seria DGIMOOZ). Sabendo que o texto foi escrito originalmente em hebraico, os pesquisadores desenvolveram um algoritmo que analisa esses anagramas e cria palavras no idioma.
“No fim das contas, 80% das palavras constavam no dicionário hebraico, mas não sabíamos se elas faziam algum sentido juntas”, disse Kondrak.
Por fim, os pesquisadores decifraram a frase inicial do manuscrito e apresentaram a Moshe Koppel, um cientista da computação que fala hebraico. Koppel disse que ela não forma uma sentença coerente em sua língua.
“No entanto, após alguns problemas de ortografia, o Google Tradutor conseguiu converter para um inglês um pouco esquisito: ‘Ela fez recomendações ao sacerdote, homem da casa e eu e pessoas’”, escreveram os pesquisadores no estudo que pode ser visto na Transactions of the Association of Computational Linguistics.
É muito estranha a forma como o manuscrito de 240 páginas é iniciado, mas pelo menos a sentença faz algum sentido.
É importante ressaltar que os pesquisadores não estão dizendo que decifraram todo o manuscrito. Na verdade, eles identificaram a origem da linguagem (no caso, hebraica) e o esquema de codificação no qual as letras foram ordenadas de uma forma particular (no caso, alfagrama). Kondrak disse que o significado completo do texto não será conhecido até historiadores com conhecimento em hebraico antigo começarem a analisar o texto.
A equipe agora planeja aplicar o novo algoritmo em outros manuscritos antigos, destacando o potencial da inteligência artificial para resolver problemas que têm intrigado os humanos por séculos.
[Transactions of the Association of Computational Linguistics]
Foto do topo: um trecho do manuscrito Voynich. (Imagem: Beinecke Rare Book & Manuscript Library, Yale University)