Que dicionário o Google Translate está usando pra fazer estas traduções?

Se você traduzir “biscoito recheado” para o inglês usando o Google Translate, não vai encontrar a tradução, e sim uma marca de biscoito recheado. Se você gosta da banda islandesa Sigur Rós e quer saber o que o nome significa em inglês, o Google traduz para “Foo Fighters”, o que está errado de muitas formas. […]

Se você traduzir “biscoito recheado” para o inglês usando o Google Translate, não vai encontrar a tradução, e sim uma marca de biscoito recheado. Se você gosta da banda islandesa Sigur Rós e quer saber o que o nome significa em inglês, o Google traduz para “Foo Fighters”, o que está errado de muitas formas. E até pouco tempo, traduzir “Lady Gaga” trazia “Britney Spears” como resultado. Estes bugs mostram como o Google Tradutor funciona.

O Tradutor não usa um dicionário para fazer as traduções. O Google explica:

Quando gera uma tradução, o Google Tradutor procura padrões em centenas de milhares de documentos para ajudar a decidir qual é a melhor tradução. Ao detectar padrões em documentos que já foram traduzidos por tradutores humanos, o Google Tradutor pode fazer escolhas inteligentes e determinar qual é a tradução apropriada. Esse processo de procurar padrões em grandes quantidades de texto é chamado de “tradução automática estatística”. Como as traduções são geradas por máquinas, nem todas serão perfeitas.

Se você não entendeu, o vídeo abaixo – também do Google – explica o processo de tradução que eles usam:

A tradução é feita usando um processo estatístico aplicado a milhares e milhares de páginas na web em línguas diferentes. É de se esperar que vários sites façam listas de bandas e artistas, então este processo pode se confundir e traduzir o nome de uma banda por outra. No caso do “biscoito recheado”, como o Oreo é um biscoito recheado, o erro não é tão absurdo assim.

E, por esse processo ser estatístico, fazer tradução de um idioma menos falado (como o malaio ou o islandês) pode das resultados como os mostrados acima, já que o número menor de páginas da web no idioma escolhido reduz a amostra usada pelo processo do Google.

Mas o Google Translate parece funcionar bem em geral (apesar de o usarmos bem menos do que alguns possam pensar…). Ah sim, “biscoito recheado” em inglês é “sandwich cookie”, Sigur Rós quer dizer “rosa da vitória”, e Lady Gaga não é Britney Spears. [Por dentro do Google Tradutor via Gawker via Reddit; valeu, Carlos Eduardo!]

fique por dentro
das novidades giz Inscreva-se agora para receber em primeira mão todas as notícias sobre tecnologia, ciência e cultura, reviews e comparativos exclusivos de produtos, além de descontos imperdíveis em ofertas exclusivas