Pesquisadores do Facebook desenvolveram uma nova ferramenta que mapeia imagens em 2D em humanos em vídeos. As imagens em segunda dimensão parecem bobas, mas são prova de conceito de que a inteligência artificial pode ser treinada para ignorar ruídos ambientais e identificar humanos em cenas complexas.

A equipe de pesquisa de inteligência artificial do Facebook publicou um estudo na semana passada detalhando o processo. O time usou uma rede neural que consegue analisar cenas complicadas em vídeos — como pessoas caminhando, dançando, jogando basquete — e identificar quais pixels pertencem a humanos. Esse é o primeiro passo.

Os pesquisadores então sobrepuseram todos os pixels de humanos com essas skins à la Minecraft. Parece bobo, mas as texturas permanecem consistentes nos vídeos, mesmo quando as pessoas se mexem e caminham. A inteligência artificial consegue mapear as texturas nos humanos, o que é um grande feito, considerando como as pessoas nos vídeos se movem imprevisivelmente (imagine como o dançar é “visto” por um computador) e estão vestindo roupas, o que altera sua silhueta.

No estudo, a equipe discute aplicações em games, particularmente no campo da realidade aumentada, em que o Facebook já expressou muito interesse anteriomente. Porém, como aponta o The Next Web, autoridades policiais e afins ficariam muito interessadas em conseguir analisar vídeos e instantaneamente isolar e categorizar pessoas em grandes públicos de acordo com seus movimentos. A fabricante de câmeras corporais Axon (conhecida anteriormente como Taser) tem trabalhado em uma tecnologia de reconhecimento de objetos parecida desde o ano passado. Pelo menos por enquanto, tudo o que podemos dizer é que os computadores conseguem agora nos “ver” melhor do que nunca.

[The Next Web]

Imagem do topo: YouTube/Alp Guler