
Google lança Veo 3 no Brasil: saiba os melhores prompts para gerar vídeos
Na última segunda-feira (26), o Google liberou o Veo 3 no Brasil, atualização do seu recurso que gera vídeos por IA e apresenta resultados impressionantes.
Assim como no ChatGPT para gerar imagens, a melhor forma de usar o Veo 3 é com prompts específicos e diretos, mas com detalhes cinemáticos. E, também como o chatbot rival, o Veo 3 costuma apresentar alguns erros durante a geração.
Há duas formas de usar o gerador de vídeos do Google. A primeira e mais prática é pelo Gemini, que, graças aos upgrades recentes, consegue compreender melhor os prompts.
Portanto, caso você queira usar prompts simples, use o Gemini porque a segunda opção, o Flow, demanda mais detalhes.
Para gerar vídeos em ambas ferramentas do Google, é preciso se inteirar sobre a ferramenta e iterar múltiplas vezes, já que os servidores estão como na época do Studio Ghibli no ChatGPT.
Saiba como gerar vídeos usando o Veo 3
A geração de vídeos usando o Veo 3 não é simples, mas também não é um bicho de sete cabeças. O que atrapalha mesmo é o Google, então é preciso conhecer as diretrizes da plataforma.
Obviamente, a ferramenta não vai gerar vídeos protegidos por direitos autorais, mas é possível se inspirar em algumas características, como Giz Brasil te mostra neste guia.
Primeiramente, liste os elementos cinemáticos, incluindo os personagens, o formato, a atmosfera, o estilo visual. A segunda parte é necessária caso você queira dar um toque profissional, listando elementos técnicos, como ângulos e planos de câmera.
Aliás, o Veo 3 compreende a estética específica de modelos de câmera, que se integra à atmosfera e ao estilo visual da fotografia. Além disso, é importante especificar os enquadramentos para o Veo 3 – tanto no Gemini quanto no Flow — compreenda a escala do vídeo que você quer gerar.
Não custa nada dizer à IA do Google algo como “faça um close-up de tal personagem” para servir como âncoras visuais dos personagens. As âncoras, que incluem aspectos físicos, roupas e aparência, ajudam a IA a entregar resultados mais fiéis.
Lembrando que tal nível de detalhe é interessante no Flow, uma das ferramentas de IA do Google que usa o Veo 3 e gera até quatro versões de vídeo. Com o Flow, você pode comparar os resultados e realizar composições de cenas, descrevendo aspectos como iluminação.
É importante ser específico e assertivo para a IA criar movimentos de luz mais realistas.
Mas se você quiser fazer algo simples, vá para o Gemini e seja feliz. No Gemini, por exemplo, usamos um prompt menor para gerar um vídeo com o Veo 3.
“headbangers com visual thrash metal no final dos anos 1980 andando pelas ruas de Belo Horizonte com o clássico visual thrash metal: tênis hi-tops, jaquetas com patches e calças skinny. Plano aberto inicial com visual vibrante, em seguida mostre os quatro membros da banda batendo cabeça (headbanging) sem que haja ninguém tocando ao redor e as cores mudam para algo mais sépia. Filmagem de VHS com close-ups no rosto de cada um quando houver a mudança tons. Close-ups com lentes teleobjetivas.”

Imagem: Screenshot/Giz Brasil
Sem vírgulas, sem muita firula e com respeito à nomenclatura. (aliás, nunca chame um “headbanger” de metaleiro). Veja o resultado:
Veo 3 usando o Google Flow
Por outro lado, a iteração no Flow foi muito mais complicada porque os vídeos que o recurso gera com o Veo 3 são muito mais complexos.
Usamos alguns prompts para criar um remake de um filme dos anos 1960 e os resultados, apesar de muito diferentes, apresentaram um toque cinemático muito maior.
“Quatro jovens músicos britânicos, na faixa dos 20 anos, trajando ternos pretos e cabelos moptop, fogem e se esquivam de uma multidão de fãs adolescentes em uma estação de trem em Londres nos anos 1960. Estilo: vibrante, filme com cores saturadas e estética sutilmente vintage com tons de comédia e mockumentary, adicionando um clima de urgência. Estética da Invasão Britânica dos anos 1960 com paleta de cores apropriadas ao período. Câmera: lentes da marca Cooke para cenas com muito ritmo, cortes rápidos, movimento dinâmico de câmera e perspectiva multi-cam. Takes em plano aberto durante a fuga, close-ups nos rostos e takes de ângulo baixo e alto para enfatizar movimento e escala. Áudio: barulho de uma enorme multidão de fãs gritando em contraste com rock dos anos 1960 e sons distantes de buzinas e da estação de trem.”
Veja como o Google evitou ao máximo qualquer referência muito direta ao filme “A Hard Day’s Night” com o vídeo gerado pelo Veo 3:
(Vale ressaltar que o Google implementa essas limitações devido ao enorme estrago que o Veo 3 pode causar se criar deepfakes).
Outras dicas

Descrever a ambientação é muito importante para obter bons resultados no Veo 3. Imagem: Giz Brasil
Gerar imagens usando o Veo 3 demanda uma certa paciência, mas há algumas maneiras de acelerar o processo (não por parte do Google, mas no sentido do resultado).
É importante ser preciso ao descrever a ação da cena, bem como o cenário. No exemplo acima, o cenário foi “estação de trem em Londres”. A atmosfera e os detalhes, como luz, são os que mais requerem um prompt específico. “Golden hour”, “Chiaroscuro” “neon” e termos objetivos são alguns exemplos.
Além disso, descrever a interação da luz é importante para a composição de sombras, bem como a paleta de cores, para criar condições atmosféricas mais fiéis.
Por fim, como no prompt que usamos, o movimento de câmera é muito importante caso você queira ser um diretor de filmes gerados por IA.