Estudante de Cambridge decodifica sânscrito misterioso após 2.500 anos
A tese do estudante de doutorado Rishi Rajpopat, da Universidade de Cambridge, publicada pela instituição de ensino inglesa nesta quarta-feira (14), pode ter decodificado a máquina de linguagem. Segundo Rajpopat, seu trabalho pode ajudar a ensinar computadores a compreender a fala humana, como é o caso dos chatbots.
A “máquina de linguagem”, algoritmo comparado aos primeiros computadores de Alan Turing, foi a técnica desenvolvida pelo indiano Dakṣiputra Pāṇini, entre os séculos 6 e 4 a.C., para descrever o funcionamento do sânscrito, língua sagrada do hinduísmo.
Seu trabalho ajudou a estabelecer a ciência da linguística para todos os idiomas existentes mais de dois mil anos depois. E, além de criar regras de sintaxe e semântica, ainda auxiliou no estudo da morfologia.
Antes de Rajpopat, estudiosos vinham tendo dificuldades com o trabalho de Pāṇini. Isso porque, em alguns momentos, mais de uma de suas regras poderia ser aplicada em um estágio da construção de palavras.
Metarregra do sânscrito
Para Rajpopat, as instruções de Pāṇini foram mal interpretadas. O estudioso forneceu uma metarregra para determinar qual regra era aplicável onde várias opções se aplicam, como uma ordem para a gramática. “No caso de conflito entre duas regras de igual força, a regra que vem depois na ordem serial da gramática vence”, diz a regra.
Os estudiosos interpretaram a metarregra como instrução. Mas Rajpopat diz que ela foi feita não para refletir a ordem de série, mas o lado esquerdo e direito da palavra. As regras se aplicavam ao lado direito da palavra dada precedência, ou seja, mais adiante na palavra, não a ordem.
A metarregra quase sempre teve resultados gramaticalmente corretos para Rajpopat. O estudante considera que sua tese pode ter relevância na forma como humanos e máquinas se comunicam.
“Os cientistas da computação que trabalham com processamento de linguagem natural desistiram de abordagens baseadas em regras há mais de 50 anos”, declarou em um comunicado.