_Tecnologia

Inteligência artificial decifra parte de papiro da Antiguidade

Equipe brasileira está entre os vencedores do prêmio internacional Vesuvius Challenge para identificar escrita em rolos carbonizados há quase 2 mil anos

Inteligência artificial decifra parte de papiro da Antiguidade

Texto: Maria Guimarães/Revista Pesquisa Fapesp

O Vesuvius Challenge propõe um desafio: desenrolar virtualmente papiros carbonizados durante uma das erupções do vulcão Vesúvio, na Itália, há quase 2 mil anos. “Apesar de armazenados há décadas em museus na Itália, eles haviam sido dados como perdidos”, conta o cientista da computação Odemir Bruno, do Instituto de Física de São Carlos da Universidade de São Paulo (IFSC-USP), integrante de uma das equipes vencedoras. A cerimônia de premiação aconteceu no dia 16/3 na Villa Getty, em Los Angeles, Estados Unidos. O local é uma reprodução da mansão do Império Romano onde os papiros foram encontrados e três brasileiros estavam lá, celebra o pesquisador, que não pôde comparecer.

“Achava-se que não restava nada escrito neles, as tentativas anteriores destruíram o material”, relata Bruno. Os papiros foram desenterrados em 1750, em Herculano, Itália, inicialmente por um fazendeiro que cavava um poço e encontrou a mansão que provavelmente pertenceu a Lúcio Calpúrnio Pisão Cesonino (?-43 a.C), sogro do imperador Júlio César (100 a.C.-44 a.C.). As cinzas que soterraram a edificação preservaram, pelo que se sabe até agora, mais de 600 rolos de papiro. Em contato com o ar, já se teriam desfeito.

A carbonização paradoxalmente os preservou, protegidos da decomposição natural, mas como abri-los? A resposta veio em 2015, quando o cientista da computação norte-americano Brent Seales, da Universidade do Kentucky, propôs usar a digitalização por tomografia de raios X para registrar e virtualmente desenrolar os papiros. Foi esse o ponto de partida do concurso lançado em 2023: seria investigado um dos quatro rolos digitalizados no acelerador de partículas Diamond, no Reino Unido. O processo gera uma infinidade de imagens que, empilhadas, formam uma imagem tridimensional. O prêmio foi criado pelos investidores norte-americanos Nat Friedman e Daniel Gross, em parceria com Seales, e custeado por uma série de financiadores – sobretudo a Fundação Musk.

“A técnica para desenrolar estava desenvolvida, mas continuava tudo preto”, conta Bruno. Isto é, não dava para enxergar nada. Haveria algum resquício identificável de tinta no material carbonizado? O caminho foi apelar à inteligência artificial para encontrar as marcas. “Uma comunidade global de competidores e colaboradores se uniu para desvendar o problema com visão computacional, aprendizado de máquina e trabalho duro”, relata o site do concurso. O primeiro desafio, identificar uma letra, foi superado pelo físico australiano Casey Handmer. Ele descobriu, nas imagens, padrões craquelados que sugeriam a forma de letras. Depois disso, a ambição foi crescendo.

O desafio de 2023 permitiu detectar 5% do texto. Imagem: Institut de France / Vesuvius Challenge

O objetivo da etapa final era ler, em um dos quatro pergaminhos já digitalizados, quatro trechos com um mínimo de 140 caracteres, reconhecendo ao menos 85% deles. A meta foi ultrapassada pelas quatro equipes vencedoras. Em primeiro lugar ficou a composta por um doutorando em biorrobótica egípcio, um estudante de engenharia norte-americano e um estudante de robótica suíço, que receberam US$ 700 mil de prêmio. Em segundo lugar, três equipes empataram e receberam US$ 50 mil cada uma – uma delas brasileira, liderada pelo físico computacional Elian Rafael Dal Prá, estudante de iniciação científica, com participação também de Leonardo Scabini, pesquisador em estágio de pós-doutorado, ambos do grupo de Bruno. “Dal Prá leu sobre o prêmio e trouxe a ideia para nosso grupo, então resolvemos mudar seu projeto”, conta o orientador, que avalia que essa forma criativa de abordar um enigma científico foi um sucesso, atraiu muitos jovens e divulgou o assunto.

O desafio é mais do que uma competição. De acordo com o site, o avanço não teria se dado sem que os resultados das etapas sucessivas fossem compartilhados com toda a comunidade. Bruno define os adversários: “Somos colegas, o avanço na leitura se dá pela combinação dos resultados de todos”. Essa etapa pós-computacional é feita por uma equipe de historiadores e papirólogos, ávidos por decifrar os escritos milenares. O que dá para saber por enquanto é que o texto foi escrito em grego e tem por base a filosofia de Epicuro, em que o prazer tem importância central. Na parte decifrada, que corresponde a 5% do total, o autor – supostamente Filodemo, aprendiz de Epicuro, que seria filósofo residente na mansão – se questiona se a disponibilidade de bens afeta o prazer que proporcionam. “Como é o caso com respeito à comida, não pensamos de imediato que as coisas escassas sejam absolutamente mais prazerosas do que aquelas que são abundantes”, escreveu.

Este ano, Dal Prá entrou no mestrado e pretende continuar o trabalho. “Não necessariamente para ganhar o próximo prêmio, mas queremos estudar quais avanços podem ser atingidos pelos códigos desenvolvidos no contexto do desafio”, explica Bruno. A receita de bolo de cada equipe, ele conta, está disponível na plataforma Github para que qualquer pessoa possa continuar o desenvolvimento. “A comparação entre os quatro métodos premiados pode gerar conhecimento sobre estratégias computacionais que sejam úteis também para resolver outros problemas.”

Da mesma maneira que os códigos computacionais conseguiram encontrar sinais de tinta em papiros carbonizados, também podem ajudar a identificar células tumorais em uma imagem, por exemplo. O grupo de São Carlos é reconhecido por seu trabalho com esse tipo de aplicação: o método computacional para análise de textura batizado como Radam (sigla para Random encoding of Aggregated Deep Activation Maps), descrito em novembro na revista científica Pattern Recognition, está há um ano no topo do ranking DTD, da plataforma “papers with codes”, grupo independente que compara resultados das publicações sobre inteligência artificial.

O desafio de 2024 será chegar a 90% de leitura dos quatro rolos já digitalizados. A corrida já começou.

Projetos
1. Rumo à convergência de tecnologias: De sensores e biossensores à visualização de informação e aprendizado de máquina para análise de dados em diagnóstico clínico (nº 18/22214-6); Modalidade Projeto Temático; Pesquisador responsável Osvaldo Novais de Oliveira Junior (USP); Investimento R$ 14.050.528,68.
2. Análise de autômato de rede (network automata) como modelo para processos naturais e biológicos (n° 21/08325-2); Modalidade Auxílio à Pesquisa – Regular; Convênio Research Foundation – Flanders (FWO) Pesquisador responsável Odemir Martinez Bruno (USP); Investimento R$ 333.063,71.

Artigo científico
SCABINI, L. et al. RADAM: Texture recognition through randomized aggregated encoding of deep activation maps. Pattern Recognition. v. 143, 109802. nov. 2023.

Sair da versão mobile