Ainda estamos tentando descobrir as melhores aplicações para as redes neurais, machine learning (aprendizagem de máquina) e todos os recentes avanços na inteligência artificial. Entre todas as pesquisas práticas que estão sendo realizadas, há também muitas experiências frívolas sendo feitas com resultados que ficam ente o fascinante e o aterrorizante.
O processamento automatizado de imagens tem surgido como um uma aplicação interessante para as redes neurais artificiais. Boa parte dos resultados são obtidos a partir da tradição que temos de compartilhar fotos e selfies uns dos outros na internet.
Pesquisadores utilizam os vastos arquivos de fotos das redes sociais para criar programas que envelhecem as pessoas ou até para misturar rostos e criar coleções de fotos de faces fotorrealistas de pessoas que nem existem.
A indústria de agências de fotografias nunca mais será a mesma, mas Mario Klingemann se perguntou o que aconteceria se essas redes neurais artificiais que produzem imagens falsas fossem sincronizadas com músicas, gerando diferentes expressões a cada batida.
Klingemann utilizou a rede generativa StyleGAN2, que foi criada pela Nvidia e lançada como uma ferramenta de código aberto há mais de um ano. Ele não fez nenhum treinamento de imagem personalizado, mas modificou o software para ajustar seus resultados de saída com base no espectro sonoro de um determin$ado arquivo de áudio, que neste caso é a música Triggernometry de Kraftamt.
Alguns dos seguidores de Klingemann no Twitter repararam que não era uma boa ideia pausar os vídeos em determinados momentos.
Indeed. I do not recommend pausing this. Some of my favourites pic.twitter.com/O77rnS8WkG
— __orderandchaos (@__orderandchaos) March 30, 2020
Tradução: Alguns dos quadros me fizeram morrer de rir, mas também fiquei horrorizado ? mas caramba, isso é incrível!
Realmente. Eu não recomendo pausar o vídeo. Alguns dos meus favoritos.
Eles têm um bom ponto. Talvez não seja uma boa ideia assistir esse vídeo antes de ir dormir.