Ferramenta de IA da Nvidia mostra como seu bichinho de estimação seria se fosse outro animal

Nova ferramenta GANimals, da Nvidia, analisa apenas algumas fotos para mostrar como seu bichinho de estimação seria se fosse outro animal.

Andrew Liszewski

5 anos atrás

É claro que você ama seu cão/gato/animal atualmente na moda que as pessoas mantêm como animais de estimação, mas existe a chance de você gostar mais dele se ele fosse de uma raça diferente? Você não pode simplesmente trocar seu Golden Retriever para fazer um test-drive no fim de semana com um Schnauzer, mas com a nova ferramenta GANimals da Nvidia, você pode pelo menos ver se seu querido animal de estimação seria ainda mais fofo como outro animal.

No início deste ano, a Nvidia Research impressionou a internet com sua ferramenta de desenho GauGAN, desenvolvida com inteligência artificial, que pegou esboços que pareciam ter sido criados em uma ferramenta básica como o MSPaint e os transformaram em imagens quase realistas.

Essa ferramenta exigia que os usuários indicassem quais partes de uma imagem deveriam ser água, árvores, montanhas e outros pontos de referência, escolhendo a cor apropriada do pincel, mas o GANimals é completamente autônomo. Você simplesmente faz o upload de uma foto do seu animal de estimação e ela gera uma série de outras imagens fotorrealistas que parecem ter a expressão do seu melhor amigo.

Em um artigo compartilhado na Conferência Internacional sobre Visão Computacional em Seul, na Coréia, nesta semana, os pesquisadores descrevem um algoritmo que eles desenvolveram chamado FUNIT, cuja sigla em inglês significa “tradução de imagem para imagem, sem supervisão, de poucos retratos”.

Ao usar a IA para traduzir as características de uma imagem de origem em uma imagem de destino, a inteligência artificial geralmente precisa ser treinada com uma grande coleção de imagens de destino, com níveis variados de luz e ângulos de câmera, para produzir com precisão resultados que realmente pareçam que a origem e os destinos foram mesclados corretamente.

Mas montar um grande banco de dados de imagens como esse consome tempo e limita o que a rede de tradução com inteligência artificial pode fazer. Se você treinou o sistema para transformar galinhas em perus, essa é a única coisa em ele que será bom.

Em comparação, o algoritmo FUNIT pode ser treinado usando apenas algumas imagens do animal alvo, com as quais ele pratica repetidamente (modo de dizer), para que possa eventualmente generalizar as traduções necessárias para mesclar duas imagens. Uma vez suficientemente treinado, o algoritmo precisa apenas de uma única imagem de origem e de destino dos animais, que podem ser completamente aleatórios e nunca processados ou analisados anteriormente, para fazer a sua mágica.

Você pode experimentar o GANanimals no AI Playground da Nvidia, mas, por enquanto, os resultados são de baixa resolução e não são adequados para nada além de curiosidade. Os pesquisadores esperam, eventualmente, melhorar as capacidades de IA e algoritmo para que, em breve, trocas de rosto possam ser realizadas sem a necessidade de bancos de dados gigantes de imagens cuidadosamente selecionadas.