Robô usa inteligência artificial para “prever futuro” aprendendo como um bebê

Para crianças pequenas, brincar com brinquedos não é só diversão — é uma maneira importante de aprenderem como o mundo funciona. Usando uma metodologia parecida, pesquisadores da Universidade da Califórnia em Berkeley desenvolveram um robô que, como uma criança, aprende do zero e experimenta com objetos para descobrir como movimentá-los melhor. E ao fazê-lo, esse robô […]

Para crianças pequenas, brincar com brinquedos não é só diversão — é uma maneira importante de aprenderem como o mundo funciona. Usando uma metodologia parecida, pesquisadores da Universidade da Califórnia em Berkeley desenvolveram um robô que, como uma criança, aprende do zero e experimenta com objetos para descobrir como movimentá-los melhor. E ao fazê-lo, esse robô é basicamente capaz de ver seu próprio futuro.

O sistema robótico de aprendizado desenvolvido pelos pesquisadores do Departamento de Engenharia Elétrica e Ciências da Computação da UC Berkeley visualiza as consequências de suas ações futuras para descobrir maneiras de mover objetos no tempo e espaço. Chamado de Vestri e usando a tecnologia “previsão visual“, o sistema consegue manipular objetos que nunca havia visto antes e até evitar objetos que possam estar no caminho.

Importante dizer, o sistema aprende do zero, usando sessões exploratórias sem supervisão ou guias para descobrir como o mundo funciona. Esse é um importante avanço porque o sistema não requer um exército de programadores para codificar cada contingência física possível, o que, dado o quão complicado e variado o mundo é, seria uma tarefa extremamente onerosa (e intratável). No futuro, versões escaladas desse sistema preditivo de autoaprendizagem poderiam tornar os robôs mais adaptáveis em locais de fábrica e residenciais, além de ajudar veículos autônomos a prever eventos futuros na estrada.

Liderados por Sergey Levine, professor assistente da UC Berkeley, os pesquisadores construíram um robô capaz de prever o que verá através de uma câmera se fizer uma certa sequência de movimentos. Como apontado, o sistema não é pré-programado, em vez disso aprendendo por meio de um processo chamado aprendizado de reforço baseado em modelo. Parece espalhafatoso, mas é parecido com a maneira como uma criança pequena aprende como mover objetos por meio de repetição e tentativa e erro. Psicólogos infantis chamam isso de “balbucio motor”, e os pesquisadores da UC Berkeley aplicaram a mesma metodologia e terminologia ao Vestri.

“Da mesma maneira que conseguimos imaginar como nossas ações vão mover os objetos em nosso ambiente, esse método consegue possibilitar que um robô visualize como comportamentos diferentes vão afetar o mundo em torno dele”, disse Levine em um comunicado. “Isso pode habilitar o planejamento inteligente de habilidades altamente flexíveis em situações complexas no mundo real.”

Para treinar o sistema, os pesquisadores deixaram o robô “brincar” com vários objetos em uma pequena mesa. Uma forma de inteligência artificial conhecida como aprendizagem profunda foi aplicada à previsão de vídeo recorrente, permitindo ao robô prever como os pixels de uma imagem se moveriam de um frame para o outro baseado em seus movimentos. Em testes, o modelo do mundo autoadquirido do robô lhe permitiu mover objetos com que nunca havia lidado antes para os locais desejados (às vezes tendo que movê-los em torno de obstáculos).

“As crianças conseguem aprender sobre seu mundo ao brincar com brinquedos, movendo-os, agarrando-os e assim por diante. Nosso objetivo com essa pesquisa é possibilitar que um robô faça o mesmo: aprender sobre como o mundo funciona por meio de interação autônoma”, disse Levine. “As capacidades desse robô ainda são limitadas, mas suas habilidades são aprendidas completamente de forma automática, permitindo-lhe prever interações físicas complexas com objetos que ele nunca viu antes, partindo de padrões de interação observados anteriormente.”

Como Levine aponta, o sistema ainda é bastante básico e só consegue prever alguns segundos no futuro. Em algum momento, um sistema de autoaprendizagem como esse poderia aprender como as coisas funcionam dentro de uma fábrica e ter a previsão para evitar trabalhadores humanos e outros robôs que possam estar no mesmo ambiente. Isso também poderia ser aplicado em veículos autônomos, em que esse modelo preditivo poderia, por exemplo, conduzir um veículo em baixa velocidade se aproximando de um engarrafamento, ou evitar uma colisão.

Para a equipe de Levine, o próximo passo será fazer com que o robô execute tarefas mais complexas, como pegar e soltar objetos e manipular objetos macios e maleáveis, como panos, cordas e objetos frágeis.

[NIPS Conference]

fique por dentro
das novidades giz Inscreva-se agora para receber em primeira mão todas as notícias sobre tecnologia, ciência e cultura, reviews e comparativos exclusivos de produtos, além de descontos imperdíveis em ofertas exclusivas