Usar machine learning (aprendizado de máquina) para trocar uma imagem por outra não é novidade. No entanto, é só pedir para que sistemas façam algo um pouco mais complicado do que uma simples troca de rosto e os resultados são terríveis.

Agora, pesquisadores afirmar ter desenvolvido uma técnica que produz imagens muito mais convincentes, mesmo em cenários complexos. Segundo eles, a inteligência artificial é capaz de trocar calças por saias, copos por garrafas, ou um rebanho de ovelhas por várias girafas.

Os cientistas do Instituto Avançado da Coreia para Ciência e Tecnologia e da Universidade de Pohang de Ciência e Tecnologia afirmam que a técnica, batizada de InstaGan, se destaca pela capacidade de lidar com alterações nas formas e por conseguir alterar vários elementos de imagem ao mesmo tempo.

O método, baseado em redes geradoras de adversários (GANs, na sigla em inglês), processa informações de instâncias, como a capacidade de identificar objetos e limites em imagens. Em seu artigo, os pesquisadores escrevem que acreditam ser os primeiros a desenvolver tal técnica em imagens mais complexas.

Os resultados são bastante impressionantes. Mulheres em fotos em um cenário cheio de informações têm suas calças trocadas por saias sem nenhuma mudança discernível no fundo. Mas o resultado não é completamente impecável: as pernas estão um pouco desfocadas.

Imagem: Sangwoo Mo, Minsu Cho, Jinwoo Shin

As imagens que mostram como o sistema troca várias ovelhas por girafas são mais impressionantes. Tanto o fundo quanto os animais parecem realistas, especialmente se comparados a outros sistemas que tentam fazer a mesma coisa. Os pesquisadores fizeram questão de contrastar a técnica com métodos anteriores, que produzem alguns híbridos de ovelhas-girafa ou ovelhas aparentemente sem cabeça.

Os pesquisadores apontam uma série de possibilidades de uso. Os exemplos de troca de peças roupas, por exemplo, podem ser usados por pessoas interessadas em comparar diferentes itens em uma loja virtual. Eles também observam que essa pesquisa pode se aplicar à tradução automática neural – o processo de usar inteligência artificial para prever o que as palavras podem vir a seguir em uma frase – e na geração de vídeos.

Naturalmente, existem formas nefastas de se usar essa tecnologia. A partir do momento que temos um sistema capaz de gerar conteúdo falso que convence as pessoas, as preocupações com o uso intencional dessas técnicas aumentam.

Tais ferramentas já existem – e estão sendo exploradas de forma negativa – mas essa provavelmente será usada para ajudar a promover o trabalho de outros pesquisadores bem intencionados.

[VentureBeat]