Como usar o Audacity para transcrever áudios com IA de graça

Por meio do modelo de inteligência artificial Whisper, da OpenAI, Audacity pode transcrever e traduzir áudios direto pelo software. Veja o passo a passo para usar o recurso

Murilo Tunholi

8 meses atrás

Audacity permite transcrever áudios com IA por meio da API Whisper

Transcrever áudios é uma tarefa que, apesar de necessária, toma bastante tempo de pesquisadores, jornalistas e podcasters. Com o avanço da inteligência artificial, surgem ferramentas que transformam falas em textos, como o próprio Audacity — popular software gratuito de captação e edição de áudios.

No início deste ano, o Audacity recebeu diversas ferramentas de IA desenvolvidas pela Intel como parte do pacote de plugins OpenVINO. Um dos recursos é a tecnologia Whisper, criada pela OpenIA, que permite transcrever e traduzir áudios sem esforço.

O Whisper fica integrado no próprio Audacity, sem custo adicional, e tem suporte a mais de 50 idiomas, incluindo português, inglês, espanhol, francês, alemão, japonês, chinês e até russo. A tradução, porém, só funciona de outros idiomas para o inglês — o inverso ainda não está disponível.

Vale mencionar que, atualmente, o Audacity oferece transcrições baseadas no modelo de IA mais simples do Whisper. Isso significa que, por ser menos treinada, a inteligência artificial pode apresentar resultados menos assertivos.

Audacity permite transcrever áudios com IA por meio da API Whisper (Imagem: Audacity/Divulgação)

Mesmo assim, usar a transcrição automática pode economizar tempo, adiantando parte do processo. Logo abaixo, o Giz Brasil mostra como transcrever áudios com IA pelo Audacity.

Como transcrever áudios com IA pelo Audacity

A seguir, separamos os passos entre os processos de instalação e execução do plugin.

Instalação do OpenVINO

Baixe e instale o Audacity no computador Windows. A ferramenta de transcrição só funciona no programa a partir da versão 3.4.2;
Acesse o GitHub do projeto OpenVINO;
Baixe os arquivos “OpenVINO-Module-3.4.2-R1.zip” e “openvino-models.zip”;
Abra o “OpenVINO-Module-3.4.2-R1.zip” e extraia todos os arquivos na pasta onde o Audacity foi instalado (normalmente fica em “C:\Arquivos de Programas\Audacity”);
Abra o “openvino-models.zip” e extraia a pasta “openvino-models” onde o Audacity foi instalado (normalmente fica em “C:\Arquivos de Programas\Audacity”);
Depois de extrair todos os arquivos de ambos os arquivos .zip, execute o Audacity;
No Audacity, vá em Editar > Preferências
Selecione a seção Módulos e altere o “mod-openvino” de Novo para Ativado. Depois, clique em “OK”;
Reinicie o Audacity para ativar os módulos do plugin;

Execução do OpenVINO

Importe o áudio que deseja transcrever para o Audacity;
Selecione o áudio na linha do tempo e vá em Analisar > OpenVINO Whisper Transcription;
No menu “OpenVINO Inference Device”, selecione “GPU”;
Em “Whisper Model”, selecione “base”
Na opção “Modo”, escolha “transcribe”;
Em “Source Language”, deixe “auto” (se quiser que a IA identifique o idioma) ou selecione o idioma manualmente;
Clique em “Aplicar” e aguarde a transcrição ficar pronta.

Quando a transcrição acabar, o texto vai aparecer logo abaixo do áudio na linha do tempo. As falas, aliás, ficarão sincronizadas com os tempos no arquivo, facilitando o processo de encontrar frases específicas ou legendagem.

É possível também exportar o conteúdo em texto para visualizá-lo em aplicativos de edição, como o Word, assim como transformá-lo em legendas.