Existem muitas razões para preservar a identidade e privacidade das pessoas que aparecem em imagens compartilhadas em redes sociais. Porém, alguns métodos são mais efetivos do que outros, como demonstram pesquisadores da Universidade Duke com uma nova ferramenta que pode revelar rostos que foram pixelados.

Uma das grandes buscas do processamento de imagem é encontrar uma ferramenta capaz de aumentar a resolução de uma imagem digital sem perder detalhes ou nitidez nem criar objetos visuais esquisitos.

Os smartphones modernos são capazes de capturar imagens em resoluções bem maiores do que 20 megapixels, mas as câmeras digitais já estão por aí há muito mais tempo, produzindo arquivos de imagens digitais de resolução bastante baixa quando comparados diretamente com imagens recentes.

E enquanto as telas das TVs e dispositivos móveis ganham mais e mais pixels – já estamos entrando na era do 8K – a necessidade de ferramentas que possam aumentar a resolução efetivamente aumenta.

A abordagem típica para aumentar a resolução de uma imagem é começar com a versão em baixa resolução e usar algoritmos inteligentes para prever e adicionar detalhes e pixels, a fim de gerar uma versão em alta resolução artificialmente.

Se a resolução for muito baixa, porém, e não tiver muitas informações, detalhes muitas vezes se perdem nesse processo, resultando em uma aparência excessivamente suavizada, especialmente em rostos de pessoas.

A abordagem que uma equipe de pesquisadores da Duke University desenvolveu, chamada Pulse (Photo Upsampling via Latent Space Exploration, ou ampliação de fotos vai exploração de espaço latente, em tradução livre), aborda o problema de uma forma totalmente diferente, aproveitando o progresso feito com o aprendizado de máquina nos últimos anos.

Demonstração dos resultados do PulseDemonstração dos resultados do Pulse (a última linha na imagem) com o processamento de uma imagem em baixa resolução (a linha central) em comparação com a original (a linha de cima) em alta resolução. Imagem: Universidade Duke

O Pulse começa com uma imagem em baixa resolução, mas não funciona a partir dela, nem a processa diretamente. Em vez disso, a ferramenta utiliza a foto como uma referência para um gerador de faces baseado em inteligência artificial. Esse gerador utiliza GAN — Generative Adversarial Networks ou redes neurais contraditórias generativas. Deste modo, o software cria imagens realistas aleatoriamente.

Já vimos estas ferramentas serem utilizadas antes em vídeos onde são gerados milhares de imagens inexistentes mas realistas, mas neste caso, após a criação das faces, elas são reduzidas à resolução da referência original em baixa resolução e comparadas contra ela, procurando por correspondências.

Um processo totalmente aleatório deveria levar décadas para encontrar uma face de alta resolução que corresponda à amostra original, mas a inteligência é capaz de encontrar rapidamente uma comparação próxima e depois fazer ajustes graduais até produzir um resultado que corresponda à amostra original de baixa resolução.

É uma abordagem pouco ortodoxa que provavelmente não teria sido pensada a uma década atrás, mas dada a rapidez com que as tecnologias de deepfakes evoluíram ao longo dos últimos anos, os pesquisadores estão lidando com esses problemas a partir de novos pontos de vista.

As imagens em alta resolução criadas pela Pulse ainda não são perfeitas, e definitivamente há uma diferença notável entre as fotos em alta resolução que ela gera em relação às fotos em alta resolução capturadas pelos pesquisadores para fins de teste.

Mas conforme o software for melhorado, ele poderia ser utilizado para fins nobres e outros fins preocupantes.

Nossas melhores fotos de átomos são, na melhor das hipóteses, manchas borradas, mas no futuro, isso poderia ajudar a revelar imagens nítidas das partículas. Por outro lado, revelar o rosto de pessoas que foram ocultadas de imagens é uma clara invasão à privacidade e um risco à preservação de identidade.