Deepfakes podem resolver o problema de sincronia em filmes dublados

Empresa criou um software que utiliza IA para que o movimento facial de um ator corresponda às palavras ditas em um filme dublado.
Gif: Vimeo/Flawless

Quem não gosta de ler legendas geralmente prefere a versão dublada de um filme estrangeiro. Mas isso também pode causar um certo incômodo quando os movimentos da boca de um ator estão completamente fora de sincronia com o que está sendo dito. Portanto, uma empresa chamada Flawless criou uma solução que utiliza inteligência artificial para que o movimento facial de um ator corresponda às palavras em um filme dublado.

Existem boas razões para se preocupar com o uso de inteligência artificial e ferramentas de rede neural para manipular fotos e vídeos a fim de criar situações que nunca aconteceram ou fazer figuras públicas aparecerem dizendo algo que não disseram (como os deepfakes que se espalham rapidamente pela internet). Mas essas ferramentas também têm um potencial interessante para outros usos — como continuar a tornar a produção de filmes mais acessível e econômica.

Essa mesma ansiedade apareceu quando a computação gráfica avançou aos trancos e barrancos graças a filmes como O Exterminador do Futuro 2, Twister e Jurassic Park, que aprimoraram os efeitos visuais fotorrealistas de maneiras que nunca havíamos visto antes. Esses avanços acabaram chegando ao consumidor e, com apenas um smartphone e um laptop, criadores amadores podem produzir filmes do calibre de Hollywood sem a necessidade de um orçamento do tamanho de Hollywood.

Essas ferramentas também se tornaram cada vez mais fáceis de usar graças aos avanços contínuos no processamento de imagens baseado em IA. Apagar objetos manualmente em um videoclipe já foi um processo muito demorado, que exigia máscaras complexas e ajustes quadro a quadro, mas agora é um recurso padrão e automatizado no After Effects da Adobe.

O que a Flawless está prometendo fazer com seu software TrueSync é usar as mesmas ferramentas responsáveis ​​por vídeos deepfake para manipular e ajustar o rosto de um ator em um filme de modo que os movimentos de suas bocas, e por sua vez os músculos de seus rostos, correspondam mais fielmente a como eles se moveriam se a atuação original fosse no idioma que um público estrangeiro está ouvindo. Portanto, mesmo que um ator tenha feito um filme em inglês, para um espectador em Berlim assistindo ao filme dublado em alemão, parecerá que todos os atores estão realmente falando alemão.

Isso é necessário? Essa questão certamente está em debate. Parasita, que levou o Oscar de Melhor Filme em 2020, reacendeu a discussão sobre dublar um filme estrangeiro em vez de simplesmente assisti-lo com legendas. Parte da audiência sente que uma sequência interminável de texto sobre um filme distrai e tira o foco de tudo o que está acontecendo na tela, enquanto outros acreditam que mesmo uma dublagem bem feita simplesmente não consegue igualar ou recriar as emoções por trás da atuação do ator original, e ouvi-las, mesmo que as palavras não sejam compreendidas, é importante para desfrutar de sua atuação como um todo.

A Flawless diz: “No coração do sistema está um mecanismo de preservação da performance que captura todas as nuances e emoções do material original.” Portanto, apesar do rosto de um ator ser substituído, sua performance original com nuances será preservada e transportada para o rosto “fixo” com os movimentos labiais corretos para uma língua estrangeira. A empresa compartilhou alguns exemplos do que a ferramenta TrueSync é capaz em seu site e, com certeza, Tom Hanks parece estar falando um japonês perfeito em Forrest Gump.

Assine a newsletter do Giz Brasil

Mas ainda há algo errado com esses clipes processados ​​via TrueSync. Eles não parecem tão naturais quanto as performances originais, e a tecnologia por trás deles, ainda em seus dias iniciais, é parcialmente responsável por isso. Até mesmo empresas como a Disney estão trabalhando para melhorar a qualidade da tecnologia deepfake, de modo que logo ela seja boa o suficiente para o que Hollywood exige. A grande questão é se essa abordagem é melhor ou pior do que as opções que temos hoje para tornar um filme acessível a um público mais amplo, e se vale a pena o custo adicional de atualizar um filme inteiro de duas horas.

fique por dentro
das novidades giz Inscreva-se agora para receber em primeira mão todas as notícias sobre tecnologia, ciência e cultura, reviews e comparativos exclusivos de produtos, além de descontos imperdíveis em ofertas exclusivas