Esta IA transformou uma única foto em vídeo de dancinha; assista
Já pensou em postar um vídeo seu no TikTok performando uma dança, sem ter que aprender a coreografia e gravar o vídeo? Pois é, pode ser que isso se torne realidade em breve. Um novo modelo IA (Inteligência Artificial) pode criar um vídeo com uma dança individual a partir de uma única fotografia.
Uma imagem estática já é o suficiente para gerar um vídeo daquela pessoa dançando, e os resultados são surpreendentes e realistas. A tecnologia é batizada de DisCo (“Controle Desembaraçado para Referir a Geração de Dança Humana no Mundo Real”, em tradução livre).
Veja abaixo o resultado, publicado no YouTube pelos responsáveis.
A iniciativa é fruto do trabalho de cientistas da Microsoft e de uma equipe da Universidade Tecnológica de Nanyang, em Singapura, liderada pelo pesquisador Tan Wang. Os pesquisadores treinaram a tecnologia usando as danças mais populares do momento: as famosas “dancinhas” do TikTok.
Com base nessas coreografias e trends, os pesquisadores conseguiram transformar uma imagem estática em um vídeo de dança semelhante aos que são compartilhados diariamente na rede social. As informações são do site BGR.
Como foi criado o modelo
Basicamente, o DisCo funciona da seguinte forma: a tecnologia divide uma fotografia em três partes – o plano de fundo, o primeiro plano (onde está a pessoa na foto) e a pose da pessoa na imagem. Então, a IA pode gerar uma série de poses diferentes daquela mesma pessoa para criar quadros individuais.
Quando compilados em um vídeo, esses “frames” gerados pela tecnologia produzem imagens realistas dessa pessoa dançando. Divulgada pela equipe de pesquisadores, a imagem abaixo mostra como funciona o processo, com dois exemplos. As imagens estáticas originais aparecem à esquerda, os frames com as poses geradas pela IA no meio, e à direita estão os quadros com as imagens artificiais que formam o vídeo.
A equipe treinou o DisCo com cerca de 700 mil imagens genéricas de pessoas coletadas em posts do TikTok, para ensinar a tecnologia sobre as diferentes poses durante uma coreografia e como separar o primeiro plano do fundo da foto.
Então, os pesquisadores filtraram mais o processo, treinando a IA com cerca de 350 vídeos de dança, cada um com 10 a 15 segundos de duração. Isso deu à tecnologia um conhecimento ainda mais profundo de como as pessoas se movem enquanto dançam.
Tecnologia tem potencial – para o bem e para o mal
Essa novidade pode permitir que os usuários gerem vídeos de dança de si próprios no TikTok, mas sem precisar aprender as coreografias. No entanto, essa possibilidade pode fomentar o aumento de deepfakes nas redes sociais.
Os produtores de filmes e programas de TV poderiam usar o DisCo na fase de pós-produção. Os estúdios poderão adicionar rotinas de dança para seus atores em novos projetos sem nunca precisar contratar dançarinos.
A tecnologia de IA está sendo cada vez mais usada na produção de filmes. No ano passado, os cineastas usaram a tecnologia deepfake para dublar visualmente o filme “A Queda” (2022).
Os produtores tiveram que remover os palavrões do filme, mas não tinham orçamento para refazer as cenas. Assim, a tecnologia serviu para resolver o problema. Os usuários também podem usar o software para alterar a linguagem falada de atores nos filmes.