Este motor de buscas vasculha a deep web – onde o Google não vê – para combater crimes
Há um ano, a DARPA – agência do governo americano que desenvolve tecnologias militares – anunciou uma missão inspirada pela ficção científica: criar um motor de busca que pudesse encontrar coisas na deep web, que rastreadores do Google não conseguem ver.
O projeto Memex já está em andamento e, pela primeira vez, pudemos ver em ação esta ferramenta para combate ao crime. A DARPA demonstrou a tecnologia para a Scientific American e o programa de TV 60 Minutes, e os recursos parecem alucinantes. O Memex – combinação das palavras “memória” e “índice” em inglês – parece vagamente algo que você veria em Minority Report.
Deep web
Na superfície, o Memex funciona como um motor de busca qualquer. A diferença é que ele espalha seus tentáculos pela deep web: isto é, pelos 90% a 95% da web pública que Google e Bing não indexam. Isso inclui de tudo, desde páginas temporárias inofensivas até conteúdo pirata e sinais de atividade ilegal.
São informações que podem não importar muito para um usuário comum, mas podem ser cruciais para investigadores. Dessa forma, o Memex consegue acompanhar criminosos, especialmente os traficantes de pessoas que se mantêm tão discretos quanto possível.
Tráfico de pessoas
Por que focar no tráfico de pessoas? Chris White explica que criminosos usam essa atividade para financiar outras atividades ilícitas; e como eles se movimentam pelos EUA, estão dispostos a transportar drogas e armas.
Além disso, este tipo de crime é muito difícil de provar às autoridades, devido ao uso de anúncios temporários e conexões peer-to-peer dentro da deep web – é difícil coletar as provas necessárias. Por isso, as condenações são poucas.
Isso já está mudando. Em 2012, uma mulher ficou presa em cativeiro em Nova York; no ano passado, um dos homens responsáveis foi condenado à prisão – a pena vai variar entre 50 anos e perpétua. Isso aconteceu graças a evidências descobertas na deep web através do Memex. A ferramenta está sendo usada em outras 20 investigações.
Como funciona
Imagine esta situação: se um investigador criminal tem o link para um anúncio publicado por um traficante de pessoas, seria difícil encontrar pistas de outros traficantes, porque estes anúncios são eliminados antes que o Google tenha a chance de indexá-los. O Memex contorna isso.
A tecnologia consulta uma amostra muito mais ampla da internet, incluindo links da deep web, para encontrar conexões entre o termo de pesquisa e os seus resultados, além de conexões entre um resultado e outro.
Após a pesquisa inicial, o Memex então produz uma “esteira de dados”, que mostra todas as outras páginas relacionadas aos links em que você clicou, mas que não veria de outra forma. É assim:
Chris White, inventor do Memex, explica ao 60 Minutes:
Todos esses pequenos círculos são links nos quais não clicamos. Clicamos em cinco, e o Memex encontrou outros cinquenta links. Então, de forma instantânea, passamos de uma pista – um endereço de e-mail – e encontramos um número de telefone de forma automática; ele estava conectado a todas as cinco páginas que visitamos. Esse telefone estava associado a centenas de anúncios, não a apenas cinco.
Isso é apenas um dos truques. Os crawlers turbinados também são capazes de acompanhar os movimentos de traficantes de pessoas observando onde eles postam anúncios. Mais uma vez, estes são links que o Google não consegue guardar.
A atividade deles pode ser compilada em mapas de calor ou mapas de movimentos de um criminoso:
Busca de imagens
Tudo fica realmente futurista quando você leva em conta o mais recente recurso do Memex: a busca de imagens. A tecnologia em beta está sendo testada por duas promotorias, um departamento de polícia e uma organização não-governamental.
A próxima fase de testes deve começar com um grupo mais amplo de beta testers, em poucas semanas – aí é quando as coisas começam a soar mais como Minority Report. Da Scientific American:
Um dos principais objetivos desta rodada é testar novos recursos de busca de imagens que possam analisar as fotos, mesmo quando partes não estiverem nítidas – isso inclui os rostos de traficantes ou uma tela de televisão no fundo, que podem auxiliar os investigadores. Outro objetivo é experimentar diferentes interfaces de usuário, e experimentar arquiteturas de streaming que avaliem dados de forma urgente.
Sim, a DARPA quer capturar criminosos vendo reflexos em telas de TV. A ideia é que a tecnologia impeça traficantes de pessoas antes que eles prejudiquem mais gente.
Como diz Dan Kaufman, da DARPA, ao 60 Minutes: “a maioria das pessoas na internet faz coisas benignas e boas, mas há parasitas vivendo lá, e nós tiramos a capacidade deles de usar a internet contra nós”. [Scientific American, 60 Minutes]
Vídeo:
Foto por Chris Dlugosz/Flickr