Tecnologia

Nova versão da IA do Google ajuda a melhorar e-mails e muito mais

Modelo de geração de imagens do Gemini também recebeu novidades durante o evento Google Cloud Next 2024. Veja o que há de novo

Imagem: Unsplash/Reprodução

Por Vinicius Marques10 de abril de 2024 às 17:145 minutos de leitura

O Google apresentou oficialmente a nova — e mais potente — versão do seu chatbot de IA (Inteligência Artificial), o Gemini 1.5 Pro — sua plataforma de inteligência artificial. Agora, o chatbot é capaz de processar conteúdo em áudio e vídeo. Ou seja, ele pode funcionar sem a necessidade do usuário ter que digitar comandos em texto.

O Gemini 1.5 Pro veio a público durante o Google Cloud Next 2024, evento onde a gigante das buscas anunciou novas soluções de IA para as plataformas do Workspace — a versão paga das ferramentas do Google. Por enquanto, apenas os membros do Vertex AI (serviço que auxilia programadores no desenvolvimento de aplicativos) poderão acessar a nova versão.

A big tech reforça que a IA está muito mais “inteligente”. Isso porque ele é capaz de compreender instruções mais complexas e entender textos muito longos, sem precisar fazer ajustes no modelo. Isso inclui 1 hora de vídeo, 11 horas de áudio, bases de código com mais de 30.000 linhas de código ou mais de 700 mil palavras em um único fluxo.

De acordo com o Google, o novo modelo tem performance superior ao Gemini Ultra. Esse, ao menos em teoria, o mais poderoso modelo da empresa até agora.

A nova IA do Google usada no dia a dia

Com a nova atualização do Gemini, a IA pode ser usada para fazer análises multimodais, ou seja, em texto, imagem, áudio e vídeo. A inteligência artificial promete, por exemplo, transcrever áudios, fazer traduções, analisar dados e resumir informações de uma reunião em videochamada, sem a necessidade do trabalho de uma transcrição humana.

Assim, a IA pode (em teoria) fazer automaticamente a ata com os assuntos mais importantes de uma reunião online. Ela pode, inclusive, executar comandos e responder perguntas durante uma chamada no Google Meet.

Fora do ambiente corporativo, a ferramenta poderia ser usada, por exemplo, para identificar todas as vezes que um comentarista gritar “Gol!” em um vídeo de partida de futebol. Assim, poderia gerar automaticamente estatísticas sobre times e seus jogadores.

A empresa espera que o modelo também ajude a melhorar o atendimento de médicos a pacientes, encontrar padrões e alternativas para agilizar as cadeias de suprimentos ou melhorar os sistemas automatizados de atendimento a clientes pelas empresas.

Outras novidades do Gemini

Vale ressaltar que o Gemini 1.5 Pro é apenas uma das muitas novidades apresentadas durante o Next 2024. Outra função revelada pela empresa é o Imagen 2, um modelo de geração de imagens com base em prompts de texto — rival do DALL-E.

A principal novidade do modelo de imagem são os recursos “inpainting” e “outpainting”, que lhe permite adicionar ou remover elementos de imagens. Porém, para evitar problemas de desinformação e geração de fake news — principalmente durante um cenário de eleições –, o Google também apresentou também a marca d’água invisível SynthID, que permite averiguar sua real origem.

Tem também o Google Vids, um aplicativo de criação de vídeo destinado a apresentações. Você pode usá-lo para criar slides usando uma linha do tempo simples em que você insere arquivos do seu Google Drive. Além disso, os usuários podem pedir ao Gemini para escrever scripts, criar storyboards e até ler roteiros em voz alta usando texto para fala. A IA pode (ainda) gerar desenhos a partir de uma biblioteca de imagens.

Há ainda novidades mais corriqueiras, como uso de IA na hora de escrever um e-mail. O usuário pode clicar em um botão “Ajude-me a escrever” no Gmail para “melhorar” um texto, compor uma mensagem completa a partir de uma nota salva ou receber sugestões de escrita.

Durante uma sessão de bate-papo, o usuário pode pedir para a que a inteligência artificial faça traduções em 69 idiomas ou tomar notas sobre a conversa. A IA do Google promete facilitar o trabalho de compartilhar documentos ou proteger informações confidenciais ou privadas.

Aliás, a IA pode ainda planejar facilmente o roteiro completo das suas próximas férias.

“O mundo está mudando, mas no Google, nossa estrela do norte é a mesma: tornar a IA útil para todos, para melhorar a vida do maior número possível de pessoas”, diz o Google em comunicado.

Toda essa tecnologia deverá ter suporte para dezenas de idiomas, incluindo o português. A expectativa é que o lançamento oficial dessas ferramentas ocorra a partir de junho.

Google segue tentando superar popularidade ChatGPT

O Google busca competir de igual para igual com o ChatGPT, da OpenAI. Após uma estreia bastante desastrada do então Bard AI, tenta consolidar suas ferramentas de IA no mercado de tecnologia. A empresa encontrou sucesso no segmento mobile. Ela vem oferecendo recursos de inteligência artificial para apps nativos do sistema Android — e que podem aparecer também na próxima versão do iOS.

Mesmo com um cenário um pouco mais favorável, a empresa ainda não escapa das polêmicas. A mais recente envolve seu gerador público de imagens, que saiu do ar após sofrer acusação de “forçar diversidade” por gerar resultados historicamente imprecisos.