Quem já assistiu a CSI e tem a mínima noção de edição de imagens sabe que o “aproximar” e “aprimorar” usados pelos detetives para analisar imagens de segurança em baixíssima qualidade estão longe de ser realistas – na vida real, os pixels das imagens estouram quando se aproxima e aumenta a imagem demais, tornando-a ainda menos visível. Mas graças a alguns algoritmos, essa técnica pode deixar de ser apenas ficção.

A tecnologia por trás da criação de uma imagem grande usando uma imagem em baixa resolução é chamada de “single-image super-resolution” (SISR), ou super-resolução de uma imagem única, em tradução livre. A técnica é estudada há décadas, mas seus resultados nunca foram muito satisfatórios. Como explica o Techxplore, softwares podem adicionar pixels extras ao redor dos pixels originais, mas o resultado termina em um borrão.

Tendo como base a tecnologia de SISR, cientistas do Max Planck Institute for Intelligent Systems, em Tubinga, na Alemanha, desenvolveram uma inteligência artificial para criar versões em alta resolução de imagens em baixa resolução.

Da esquerda para a direita, a imagem em baixa resolução, a mesma imagem após ser tratada pelo EnhanceNet-PAT e a imagem original (Imagem: Max Planck Institute for Intelligent Systems)

“O algoritmo recebe a tarefa de ampliar milhões de imagens em baixa resolução para uma resolução maior, depois, é apresentado ao software a versão original. Nota a diferença? Então aprenda com seus erros”, explica Mehdi M.S. Sajjadi ao Techxplore. Uma vez treinada, a tecnologia não precisa mais ver as fotos originais. Chamada de EnhanceNet-PAT, ela foi desenvolvida por Sajjadi em conjunto com os doutores Michael Hirsch e Bernhard Schölkopf.

“Antes deste trabalho, até o melhor dos métodos resultava em imagens borradas”, disse Sajjadi ao Digital Trends. “Isso se dava porque era pedido o impossível destas tecnologias – reconstruir uma imagem original com precisão perfeita de pixels. Como isso é impossível, o resultado acabava borrado”, afirmou. “Para um resultado melhor, a rede neural observa a foto inteira, detecta regiões e usa informação semântica para produzir texturas realísticas e imagens mais nítidas.”

Da esquerda para a direita, o resultado em outros softwares de SISR e o resultado da EnhanceNet-PAT (Imagem: Max Planck Institute for Intelligent Systems)

A tecnologia, no entanto, não é perfeita, mas é mais eficiente que outros técnicas de SISR, dizem os pesquisadores. Eles explicam que a EnhanceNet-PAT não almeja uma reconstrução perfeita, mas, sim, uma síntese de texturas fiel à imagem original. O que, para a maioria das pessoas, resulta em uma foto muito parecida com a original.

Sajjari lista inúmeras aplicações para a tecnologia, como realçar filmes antigos para 4K, restaurar retratos antigos que não produzem um bom resultado quando ampliados e até melhorar a detecção de objetos em redes neurais, como o resultado de imagens do Google e a detecção de pedestres por carros autônomos.

[Digital Trends via Techxplore]