Como a IA pode ajudar a deixar a Wikipédia mais confiável
Com mais de 61 milhões de artigos (e contando), a Wikipédia é a biblioteca mais completa da internet. Mas os administradores da plataforma têm um grande problema: como deixar a plataforma colaborativa mais confiável? A resposta para isso pode estar na inteligência artificial (IA).
Um estudo publicado este mês na revista Nature Machine Intelligence sugere que a IA pode ajudar a limpar listas de referências imprecisas ou incompletas nos artigos publicados na Wikipédia, melhorando a sua qualidade.
Fabio Petroni, da empresa Samaya AI, com sede em Londres, e seus colegas desenvolveram um sistema alimentado por redes neurais chamado Side. ELe analisa se as referências da Wikipédia que apoiam as afirmações dos artigos e sugere alternativas melhores para aquelas que não o fazem.
“Pode parecer irônico usar IA para ajudar com citações, dada a forma como o ChatGPT notoriamente falha com as citações. Mas é importante lembrar que os modelos de linguagem de IA são muito mais do que os chatbots”, disse à Nature Noah Giansiracusa, que estuda IA na Universidade Bentley em Waltham, nos Estados Unidos.
Filtro de IA na Wikipédia
O Side é treinado para reconhecer boas referências usando artigos existentes da Wikipédia, que são promovidos no site e recebem muita atenção de editores e moderadores.
Com isso, ele é então capaz de identificar reivindicações em páginas com referências de baixa qualidade por meio de seu sistema de verificação. Ele também pode pesquisar na internet em busca de fontes confiáveis e classificar opções para substituir citações ruins.
O que a IA consegue fazer
Para testar o sistema, Petroni e seus colegas usaram o Side para sugerir referências para artigos da Wikipédia em destaque que não haviam sido vistos antes.
Nos testes, em quase 50% dos casos a principal escolha da Side para referência já foi citada no artigo. Para os demais, encontrou referências alternativas.
Quando os resultados do Side foram mostrados a um grupo de usuários da Wikipédia, 21% preferiram as citações encontradas pela IA, 10% preferiram as citações existentes e 39% não tiveram preferência.