Inteligência artificial do Google aprende a jogar 49 videogames de Atari; veja-a em ação
No ano passado, o Google adquiriu a empresa de inteligência artificial DeepMind por US$ 628 milhões. Desde então, eles colocaram o software da DeepMind para trabalhar duro… jogando títulos do Atari 2600. É sério: aprender a jogar 49 diferentes jogos de Atari demonstra as promessas – e as fraquezas – desse software.
Um artigo publicado na Nature detalha como a inteligência artificial aprendeu a jogar videogames sozinha. Isso pode não parecer grande coisa em um mundo no qual supercomputadores derrotam gênios do xadrez, mas o DeepMind funciona de uma maneira diferente.
Ninguém ensinou as regras dos jogos para a IA, por isso ela teve que aprender por tentativa e erro, basicamente apertando botões aleatoriamente até descobrir a jogada certa.
Isso funciona espetacularmente bem para alguns jogos, como Space Invaders, Pong e especialmente Video Pinball, nos quais a IA superou humanos profissionais em jogos. Mas, em 20 dos 49 jogos, ela nunca foi capaz de chegar até o nível de habilidade humana. A MIT Technology Review explica o porquê:
O clássico jogo Ms. Pac-Man ilustra nitidamente a maior limitação do software: ele é incapaz de fazer planos, mesmo se forem apenas para alguns segundos no futuro. Isso impede que o sistema descubra como atravessar um labirinto de forma segura para comer todas as bolinhas e completar a fase. Ele também é incapaz de aprender que comer certas bolinhas mágicas permite comer os fantasmas que, normalmente, você deveria evitar a todo custo.
O software da DeepMind está basicamente preso ao presente. Ele só olha para os quatro últimos quadros de vídeo do jogo (ou seja, 1/15 de segundo) para saber quais movimentos valem a pena, ou como usar sua experiência passada para escolher o seu próximo movimento. Isso significa que ele só pode dominar jogos nos quais é possível avançar usando táticas que têm retornos muito imediatos.
Futuras versões do DeepMind provavelmente terão mais memória para tomarem decisões melhores de estratégia de longo prazo. E, mais à frente, ele poderia ser aplicado para resolver problemas do mundo real. O Google explica:
Este tipo de tecnologia deve nos ajudar a criar mais produtos úteis: imagine se você pudesse perguntar ao app Google para completar qualquer tipo de tarefa complexa (“Ok Google, planeje para mim uma ótima viagem de mochileiro pela Europa!”).
Esperamos, também, que este tipo de algoritmo de aprendizagem geral forneça aos pesquisadores novas formas de analisar dados complexos em larga escala, criando o potencial para descobertas emocionantes em campos como a climatologia, física, medicina e genômica. Isto pode até mesmo ajudar os cientistas a entender melhor o processo pelo qual os seres humanos aprendem coisas.
Mas, por enquanto, fique tranquilo: você provavelmente ainda pode ganhar de um computador em Ms. Pac-Man. [Nature via MIT Technology Review e Google Research Blog]
Foto por Jeff Jackowski/Flickr