Google lança Veo 3 no Brasil: saiba os melhores prompts para gerar vídeos

Confira os elementos mais importantes dos prompts para o Veo 3.

Na última segunda-feira (26), o Google liberou o Veo 3 no Brasil, atualização do seu recurso que gera vídeos por IA e apresenta resultados impressionantes.

banner

Assim como no ChatGPT para gerar imagens, a melhor forma de usar o Veo 3 é com prompts específicos e diretos, mas com detalhes cinemáticos. E, também como o chatbot rival, o Veo 3 costuma apresentar alguns erros durante a geração.

Há duas formas de usar o gerador de vídeos do Google. A primeira e mais prática é pelo Gemini, que, graças aos upgrades recentes, consegue compreender melhor os prompts.

Portanto, caso você queira usar prompts simples, use o Gemini porque a segunda opção, o Flow, demanda mais detalhes.

Para gerar vídeos em ambas ferramentas do Google, é preciso se inteirar sobre a ferramenta e iterar múltiplas vezes, já que os servidores estão como na época do Studio Ghibli no ChatGPT.

Saiba como gerar vídeos usando o Veo 3

A geração de vídeos usando o Veo 3 não é simples, mas também não é um bicho de sete cabeças. O que atrapalha mesmo é o Google, então é preciso conhecer as diretrizes da plataforma.

Obviamente, a ferramenta não vai gerar vídeos protegidos por direitos autorais, mas é possível se inspirar em algumas características, como Giz Brasil te mostra neste guia.

Primeiramente, liste os elementos cinemáticos, incluindo os personagens, o formato, a atmosfera, o estilo visual. A segunda parte é necessária caso você queira dar um toque profissional, listando elementos técnicos, como ângulos e planos de câmera.

Aliás, o Veo 3 compreende a estética específica de modelos de câmera, que se integra à atmosfera e ao estilo visual da fotografia. Além disso, é importante especificar os enquadramentos para o Veo 3 – tanto no Gemini quanto no Flow — compreenda a escala do vídeo que você quer gerar.

Não custa nada dizer à IA do Google algo como “faça um close-up de tal personagem” para servir como âncoras visuais dos personagens. As âncoras, que incluem aspectos físicos, roupas e aparência, ajudam a IA a entregar resultados mais fiéis.

Lembrando que tal nível de detalhe é interessante no Flow, uma das ferramentas de IA do Google que usa o Veo 3 e gera até quatro versões de vídeo. Com o Flow, você pode comparar os resultados e realizar composições de cenas, descrevendo aspectos como iluminação.

É importante ser específico e assertivo para a IA criar movimentos de luz mais realistas.

Mas se você quiser fazer algo simples, vá para o Gemini e seja feliz. No Gemini, por exemplo, usamos um prompt menor para gerar um vídeo com o Veo 3.

“headbangers com visual thrash metal no final dos anos 1980 andando pelas ruas de Belo Horizonte com o clássico visual thrash metal: tênis hi-tops, jaquetas com patches e calças skinny. Plano aberto inicial com visual vibrante, em seguida mostre os quatro membros da banda batendo cabeça (headbanging) sem que haja ninguém tocando ao redor e as cores mudam para algo mais sépia. Filmagem de VHS com close-ups no rosto de cada um quando houver a mudança tons. Close-ups com lentes teleobjetivas.”

Imagem: Screenshot/Giz Brasil

Sem vírgulas, sem muita firula e com respeito à nomenclatura. (aliás, nunca chame um “headbanger” de metaleiro). Veja o resultado:

Veo 3 usando o Google Flow

Por outro lado, a iteração no Flow foi muito mais complicada porque os vídeos que o recurso gera com o Veo 3 são muito mais complexos.

Usamos alguns prompts para criar um remake de um filme dos anos 1960 e os resultados, apesar de muito diferentes, apresentaram um toque cinemático muito maior.

“Quatro jovens músicos britânicos, na faixa dos 20 anos, trajando ternos pretos e cabelos moptop, fogem e se esquivam de uma multidão de fãs adolescentes em uma estação de trem em Londres nos anos 1960. Estilo: vibrante, filme com cores saturadas e estética sutilmente vintage com tons de comédia e mockumentary, adicionando um clima de urgência. Estética da Invasão Britânica dos anos 1960 com paleta de cores apropriadas ao período. Câmera: lentes da marca Cooke para cenas com muito ritmo, cortes rápidos, movimento dinâmico de câmera e perspectiva multi-cam. Takes em plano aberto durante a fuga, close-ups nos rostos e takes de ângulo baixo e alto para enfatizar movimento e escala. Áudio: barulho de uma enorme multidão de fãs gritando em contraste com rock dos anos 1960 e sons distantes de buzinas e da estação de trem.”

Veja como o Google evitou ao máximo qualquer referência muito direta ao filme “A Hard Day’s Night” com o vídeo gerado pelo Veo 3:

(Vale ressaltar que o Google implementa essas limitações devido ao enorme estrago que o Veo 3 pode causar se criar deepfakes).

Outras dicas

Descrever a ambientação é muito importante para obter bons resultados no Veo 3. Imagem: Giz Brasil

Gerar imagens usando o Veo 3 demanda uma certa paciência, mas há algumas maneiras de acelerar o processo (não por parte do Google, mas no sentido do resultado).

É importante ser preciso ao descrever a ação da cena, bem como o cenário. No exemplo acima, o cenário foi “estação de trem em Londres”. A atmosfera e os detalhes, como luz, são os que mais requerem um prompt específico. “Golden hour”, “Chiaroscuro” “neon” e termos objetivos são alguns exemplos.

Além disso, descrever a interação da luz é importante para a composição de sombras, bem como a paleta de cores, para criar condições atmosféricas mais fiéis.

Por fim, como no prompt que usamos, o movimento de câmera é muito importante caso você queira ser um diretor de filmes gerados por IA.

Pablo Nogueira

Pablo Nogueira

Jornalista e mineiro. Já escreveu sobre tecnologia, games e ciência no site Hardware.com.br e outros sites especializados, mas gosta mesmo de falar sobre os Beatles.

fique por dentro
das novidades giz Inscreva-se agora para receber em primeira mão todas as notícias sobre tecnologia, ciência e cultura, reviews e comparativos exclusivos de produtos, além de descontos imperdíveis em ofertas exclusivas