Inteligência artificial detecta insuficiência respiratória por análise de áudios

A ideia é que, no futuro, a metodologia possa integrar sistemas de telemedicina para monitorar de forma contínua pacientes internados

Agência Fapesp

9 meses atrás

Inteligência artificial detecta insuficiência respiratória por análise de áudios

Texto: Ricardo Muniz |Agência FAPESP

Caracterizada pela baixa taxa de oxigenação do sangue, a insuficiência respiratória é uma condição que muitas vezes requer hospitalização e pode ter causas diversas, incluindo asma, doenças cardíacas ou pulmonares e infecções virais. Com o objetivo de auxiliar na triagem de pacientes, pesquisadores brasileiros desenvolveram uma ferramenta baseada em inteligência artificial (IA) capaz de detectar o problema por meio da análise de áudios de fala. A ideia é que, no futuro, a metodologia possa integrar sistemas de telemedicina para monitorar de forma contínua pessoas internadas.

“Tais ferramentas permitiriam identificar a condição em pacientes com COVID-19, por exemplo, por meio da verbalização de uma frase em um celular”, explica o pesquisador Marcelo Matheus Gauy, bolsista FAPESP de pós-doutorado no Instituto de Matemática e Estatística da Universidade de São Paulo (IME-USP).

A pesquisa foi supervisionada por Marcelo Finger, professor do Departamento de Ciências da Computação da USP e coordenador do projeto Sistema de Detecção Precoce de Insuficiência Respiratória por meio de Análise de Áudio (Spira), que utiliza a inteligência artificial para comparar áudios de pessoas e foi inicialmente desenhado para reconhecer automaticamente variações na voz em pacientes com COVID-19 durante o auge da pandemia.

Os resultados foram publicados como capítulo na publicação Lecture Notes in Computer Science, resultante da 21ª International Conference on Artificial Intelligence in Medicine (Aime), realizada na Eslovênia em 2023. Colaboraram pesquisadores da USP e da Universidade Estadual Paulista (Unesp) dos campi de Marília, São José do Rio Preto e São Paulo.

Coleta de dados

O desenvolvimento da ferramenta começou pela coleta de dados de pessoas diagnosticadas com COVID-19 durante a primeira fase da pandemia. O grupo coletou vozes de aproximadamente 200 pacientes de dois hospitais parceiros do projeto, o Hospital das Clínicas da Faculdade de Medicina e o Hospital Universitário (HU), ambos da USP. E treinou modelos modernos de IA que alcançaram mais de 95% de acurácia, mostrando a viabilidade do sistema naquele momento.

Três tipos de áudios foram analisados: uma frase que induz naturalmente a pausas, uma canção infantil com pausas predeterminadas e a vogal ‘a’ sustentada. Pausas em momentos não naturais permitiram a identificação de um padrão analisado por IA.

“Durante o auge da pandemia realizamos coletas de áudio de pacientes que sofriam de insuficiência respiratória em hospitais. Coletamos também áudios de pessoas saudáveis [controle] por meio de um aplicativo na internet. Modelos de inteligência artificial atingiram acurácia da ordem de 95% na detecção de insuficiência respiratória, enquanto modelos que utilizam apenas as diferenças nas estruturas de pausa nos áudios dos pacientes e controles atingiram ordem de 87% de acurácia”, detalha Gauy.

Numa segunda etapa, foram incluídos dados de pessoas que desenvolveram insuficiência respiratória por causas diversas.

Um dos achados da sequência do estudo foi que, ao ampliar a coleta de áudios para além dos casos de COVID-19, foi preciso alterar a ferramenta, pois os resultados de acurácia ficavam abaixo de 50%. Isso mostrou que os modelos treinados para COVID não se encaixam para outras causas, indicando que, no caso de coronavírus, há características específicas.

“Modelos de inteligência artificial usados para essa tarefa precisam ser cuidadosamente treinados em uma base de dados robusta o suficiente para que as diferentes fontes de insuficiência respiratória não acabem enviesando o resultado”, diz Gauy. Por outro lado, esses achados dão esperança de que seja possível identificar, futuramente, não só a insuficiência respiratória por meio de áudio, mas também a sua causa.

O artigo Discriminant audio properties in deep learning based respiratory insufficiency detection in brazilian portuguese pode ser lido em: https://link.springer.com/chapter/10.1007/978-3-031-34344-5_32.