_Google

Por dentro do algoritmo secreto de busca do Google

Steven Levy, da Wired, fez uma viagem por dentro do "algoritmo que controla a web"  -- o algoritmo de busca do Google, claro --, e se você usa o Google, é leitura obrigatória. PageRank? Isso é muito 1997.

É sabido que o Google atualiza o algoritmo o tempo todo, com 550 melhorias só neste ano, para entregar resultados melhores e filtrar as porcarias. Mas há alguns poucos grandes updates na história do Google que alteraram significativamente o funcionamento da busca, exibidas convenientemente em um gráfico na matéria da Wired. Por exemplo: em 2001, eles reescreveram o algoritmo do zero. Em 2003, foi adicionada análise local de conectividade. Em 2005, os resultados ficaram pessoais. E mais recentemente, resultados em tempo real do Twitter e blogs.

A soma de tudo em que o Google trabalhou — a busca por entender o que você quer dizer, não o que está dizendo — pode ser resumida nisto:

"Rock" é pedra. Mas também é "stone", e pode vir a ser "boulder". Se escreverem "rokc", ainda é pedra. Mas se escreverem "little" na frente, vira "Little Rock", a capital do Arkansas. Que não é uma arca, a menos se escreva "Noé". "O cálice sagrado da busca é entender o que o usuário quer", diz Singhal. "Você não está mais juntando palavras, mas sim significados".

Ah, e caso você não saiba ainda, fique sabendo que você é um ratinho de laboratório toda vez que busca alguma coisa. Patrick Riley, engenheiro do Google, diz que "na maioria das queries do Google, você está em vários grupos de controle ou experimentais ao mesmo tempo". Isso permite a eles experimentarem em menor escala. Mesmo se eles experimentarem alguma coisa em 0,001% das queries, já é dado pra caramba.

Não deixe de ler a matéria inteira. É ridiculamente fascinante, beirando o auto-conhecimento. [Wired]

Sair da versão mobile