A Alemanha anunciou, na semana passada, que passará a testar um software de reconhecimento de voz em sua triagem de refugiados buscando asilo no país. A abordagem pode ajudar a acelerar o processamento de centenas de milhares de migrantes, mas alguns especialistas temem que a tecnologia imperfeita possa causar mais mal do que bem.

• Como o mundo da tecnologia reagiu à decisão de Trump de fechar fronteiras
• Competição escolherá primeira mulher alemã a ir ao espaço

Em 1998, a Alemanha começou a usar análise de fala para ajudar a determinar o país de origem de requerentes de asilo. Supostamente, cerca de 60% dos refugiados chegam sem os documentos de identificação necessários. Tradicionalmente, se há dúvidas sobre a terra-natal do candidato a asilo, a gravação deles tendo uma conversa é enviada a um linguista, para verificação. Com a grande crise de refugiados que afeta a região, existe uma fila de 430.000 candidaturas a serem verificadas.

Mas a análise automatizada de fala não é apenas um esforço altruísta para passar mais pessoas pelo sistema mais rapidamente. É também parte de uma iniciativa para detectar candidatos que possam, falsamente, afirmar serem de um país como a Síria para receber tratamento preferencial. A possibilidade de a tecnologia de reconhecimento de voz ser inadequada apresenta um problema para defensores de uma política de imigração flexível, que não gostariam que alguém fosse incorretamente rejeitado. E é um problema para os mais inflexíveis, que temem a entrada de pessoas nefastas com o intuito de praticar terrorismo.

O sistema, que será testado ao longo de duas semanas, foi projetado para ser usado por bancos e companhias de seguro. Idealmente, ele deveria ser capaz de reconhecer de onde um candidato é baseado em uma amostra de sua fala. Essa análise então seria comparada com outros “indicadores” e poderia levantar um alerta para revisões mais aprofundadas.

Alguns especialistas em linguística insistem que as nuances da linguagem não poderiam ser possivelmente cobertas com precisão pelo software atual. Monika Schmid, professora de linguística da Universidade de Essex, conversou com o Deutsche Welle e alertou que muitos fatores entram na análise da linguagem, como a idade, o uso de gírias e a natureza humana de se adaptar à maneira como o outro fala. Ela deu um exemplo de um estudo recente que sua equipe conduziu. Eles pediram que germanófonos identificassem um clipe de áudio de um outro germanófono. Todas as amostras eram, de fato, de pessoas que tinham o alemão como língua materna mas que moraram no exterior por pelo menos cinco anos. Repetidas vezes, o grupo de testes não acreditou que as amostras eram de falantes nativos. Pense na Madonna, quando ela retorna aos Estados Unidos após passar uma semana na Inglaterra.

Os candidatos podem fingir seu modo de falar se estão fingindo ser de algum lugar que é rastreável. “Não vejo como o software automatizado pode distinguir se uma pessoa usa certa palavra ou pronúncia de um modo particular por isso ser parte de seu próprio repertório ou porque sentem que é o melhor a se fazer diante do entrevistador ou intérprete”, diz Schmid. “Identificar a região de origem de alguém baseado em sua fala é uma tarefa extremamente complexa. Tanto humanos quanto máquina podem facilmente estar errados, mas os humanos provavelmente são melhores nisso.”

Dirk Hovy, cientista de computador da Universidade de Copenhague, concorda que produzir esse tipo de sistema preciso é uma tarefa monumental. “Criar um conjunto de dados perfeito é virtualmente impossível, porque a linguagem está constantemente mudando”, contou ao Die Welt.

[Die Welt, International Business Times, Deutsche Welle]

Imagem do topo: Getty