Transcrever áudios é uma tarefa que, apesar de necessária, toma bastante tempo de pesquisadores, jornalistas e podcasters. Com o avanço da inteligência artificial, surgem ferramentas que transformam falas em textos, como o próprio Audacity — popular software gratuito de captação e edição de áudios.
No início deste ano, o Audacity recebeu diversas ferramentas de IA desenvolvidas pela Intel como parte do pacote de plugins OpenVINO. Um dos recursos é a tecnologia Whisper, criada pela OpenIA, que permite transcrever e traduzir áudios sem esforço.
O Whisper fica integrado no próprio Audacity, sem custo adicional, e tem suporte a mais de 50 idiomas, incluindo português, inglês, espanhol, francês, alemão, japonês, chinês e até russo. A tradução, porém, só funciona de outros idiomas para o inglês — o inverso ainda não está disponível.
Vale mencionar que, atualmente, o Audacity oferece transcrições baseadas no modelo de IA mais simples do Whisper. Isso significa que, por ser menos treinada, a inteligência artificial pode apresentar resultados menos assertivos.
Mesmo assim, usar a transcrição automática pode economizar tempo, adiantando parte do processo. Logo abaixo, o Giz Brasil mostra como transcrever áudios com IA pelo Audacity.
Como transcrever áudios com IA pelo Audacity
A seguir, separamos os passos entre os processos de instalação e execução do plugin.
Instalação do OpenVINO
- Baixe e instale o Audacity no computador Windows. A ferramenta de transcrição só funciona no programa a partir da versão 3.4.2;
- Acesse o GitHub do projeto OpenVINO;
- Baixe os arquivos “OpenVINO-Module-3.4.2-R1.zip” e “openvino-models.zip”;
- Abra o “OpenVINO-Module-3.4.2-R1.zip” e extraia todos os arquivos na pasta onde o Audacity foi instalado (normalmente fica em “C:\Arquivos de Programas\Audacity”);
- Abra o “openvino-models.zip” e extraia a pasta “openvino-models” onde o Audacity foi instalado (normalmente fica em “C:\Arquivos de Programas\Audacity”);
- Depois de extrair todos os arquivos de ambos os arquivos .zip, execute o Audacity;
- No Audacity, vá em Editar > Preferências
- Selecione a seção Módulos e altere o “mod-openvino” de Novo para Ativado. Depois, clique em “OK”;
- Reinicie o Audacity para ativar os módulos do plugin;
Execução do OpenVINO
- Importe o áudio que deseja transcrever para o Audacity;
- Selecione o áudio na linha do tempo e vá em Analisar > OpenVINO Whisper Transcription;
- No menu “OpenVINO Inference Device”, selecione “GPU”;
- Em “Whisper Model”, selecione “base”
- Na opção “Modo”, escolha “transcribe”;
- Em “Source Language”, deixe “auto” (se quiser que a IA identifique o idioma) ou selecione o idioma manualmente;
- Clique em “Aplicar” e aguarde a transcrição ficar pronta.
Quando a transcrição acabar, o texto vai aparecer logo abaixo do áudio na linha do tempo. As falas, aliás, ficarão sincronizadas com os tempos no arquivo, facilitando o processo de encontrar frases específicas ou legendagem.
É possível também exportar o conteúdo em texto para visualizá-lo em aplicativos de edição, como o Word, assim como transformá-lo em legendas.