Neste exato momento, um computador está lendo toda a internet para aprender inglês
O computador se chama NELL, sigla para o sistema Never-Ending Language Learning, e é o carro-chefe de um projeto envolvendo pesquisadores da Carnegie Mellon, supercomputadores do Yahoo! e doações do Google e da DARPA. O objetivo do projeto é difícil, mas importante: criar uma máquina que consiga descobrir as sutilezas de uma língua por si próprio, sem nenhum tipo de ajuda. É o que explica Tom Mitchell, presidente do projeto: “nós ainda não conseguimos criar um computador que aprenda como os humanos aprendem, acumulando informações a longo prazo”. O NELL será o primeiro a fazer isso.
O sistema vasculha centenas de milhões de páginas da internet, coletando informações e colocando-as em uma de suas 280 categorias; classificações básicas como cidades, plantas ou atores. Ele já foi capaz de aprender 400.000 fatos até agora, com 87% de precisão. O NELL também já sabe 280 correlações, trechos da língua inglesa que conectam dois fatos. A máquina provavelmente sabe que o ator James Franco (ator) mora em (correlação) Nova York (cidade). E quanto mais o NELL aprende, mais eficiente e veloz ele fica:
Suas ferramentas incluem programas que extraem e classificam frases da internet, programas que buscam padrões e correlações, e programas para aprender regras. Por exemplo, quando o sistema lê a frase “Pikes Peak”, ele estuda sua estrutura – duas palavras, ambas começando com a mesma letra, e a última palavra é Peak. Essa estrutura sozinha já o faz pensar na probabilidade de que Pikes Peak seja uma montanha. Para completar, o NELL lê de várias formas. Ele irá atrás de frases que pareçam com Pikes Peak e frases similares, repetidamente. Por exemplo, “eu escalei XXXX”.
O doutor Mitchell explica que o NELL foi criado para se capaz de absorver palavras em contextos diferentes, usando uma hierarquia de regras para resolver ambiguidades. Esse tipo de julgamento de nuances costuma confundir os computadores. “Mas, como podemos ver, um sistema como esse trabalha melhor se você forçá-lo a aprender centenas de coisas de uma vez”, diz.
Há, claro, alguns casos em que o computador autodidata escorrega. Certa vez, o NELL colocou “internet cookies” na categorias “assados”. O resultado foi a associação de termos como “arquivos de computador” na pasta de assados também. Nesses casos, o doutor Mitchell e sua equipe corrigem o erro para não deixar o NELL seguir o caminho errado. Mas ele ressalta que nenhum ser humano aprende tudo completamente sozinho também.
Então, para que criar algo assim? Bem, um computador que entende uma língua como um ser humano pode responder dúvidas com respostas reais, e não apenas com links. Computadores pessoais poderiam ser operados apenas com frases, sem necessidade de mouses ou ícones. É um futuro interessante, não? [NYT]