A inteligência artificial generativa facilita inúmeros processos. Mas existe um custo por trás disso: os modelos para gerar textos e imagens consomem mais energia elétrica. É o que mostra um estudo que mediu as emissões de carbono causadas por modelos de IA.
A iniciativa foi realizada por Alexandra Sasha Luccioni e Yacine Jernite, da startup norte-americana Hugging Face, e por Emma Strubell, da universidade Carnegie Mellon, dos Estados Unidos. O estudo foi apresentado com o seguinte título: “Power Hungry Processing:⚡Watts⚡Driving the Cost of AI Deployment?”
Durante o experimento, os pesquisadores notaram que as tarefas de classificação consomem menos energia e emitem menos carbono. Mas não se pode dizer o mesmo quando se trata de atividades generativas, para construir textos e imagens.
Segundo o estudo, tarefas gerativas, como geração de texto e resumo, usam, em média, mais de 10 vezes mais energia para o mesmo número de inferências. Ou seja, cerca de 0,05 kWh-hora para 1.000 inferências.
Na prática, isto significa que o modelo para gerar texto mais eficiente utiliza tanto energia quanto 16% de uma carga completa de smartphone. Para a comparação, o estudo considera que a recarga de um “celular médio” requer 0,012 kWh.
O consumo aumenta consideravelmente em tarefas multimodais. Especialmente ao gerar legenda de imagens ou construir imagens a partir de texto. Neste caso, o resultado dessas tarefas varia de 0,06 a 2,9 kWh horas para 1.000 inferências.
Considerando o comparativo anterior, isto significa que o modelo menos eficiente para gerar imagem é capaz de oferecer quase uma carga de bateria por geração de imagem.
Mas o estudo aponta que existe uma grande variação entre os sistemas, a depender das suas propriedades e possibilidades.
Confira os resultados:
Tarefa | Média |
Classificação de texto | 0,002 kWh |
Controle de qualidade extrativo | 0,003 kWh |
Modelagem de linguagem mascarada | 0,003 kWh |
Classificação de tokens | 0,004 kWh |
Classificação de imagem | 0,007 kWh |
Detecção de objetos | 0,038 kWh |
Geração de texto | 0,047 kWh |
Resumo de textos | 0,049 kWh |
Legenda de imagem | 0,063 kWh |
Geração de imagem | 2,907 kWh |
Modelos de imagem também emitem mais carbono
O estudo ainda analisou a emissão de carbono a partir dos recursos de IA. Os pesquisadores apontaram que os sistemas para desenvolver imagens a partir de comandos de texto (prompts) são os mais poluentes. Mas a intensidade varia de modelo para modelo.
O grande destaque vai para o modelo Stable Diffusion XL, que gera 1.594 gramas de CO2 para 1.000 inferências. A quantidade equivale a cerca de 6,5 km dirigidos em um carro movido à gasolina.
“Isso pode aumentar rapidamente quando a imagem modelos de geração como Dall-E e MidJourney são implantados em aplicações voltadas para o usuário e usados por milhões de usuários globalmente”, diz o estudo.
Veja o comparativo por tarefas no gráfico a seguir:
Como o estudo foi realizado?
Para fazer a análise, os pesquisadores selecionaram dez tarefas de machine learning (ML) de cinco modalidades diferentes: classificação de texto, geração de texto, classificação de imagens, descrição de imagens e geração de imagens a partir de comandos de texto (prompt).
As modalidades foram escolhidas pois são tarefas em comum no processamento de linguagem natural (NLP) e visão computacional. Este fator possibilita a análise de múltiplas atividades envolvendo inteligência artificial.
Ao todo, 88 modelos foram usados para a análise. No estudo, foi utilizada uma máquina virtual hospedada no Amazon Web Services (AWS) com a GPU Nvidia A100-SMX4 de 80 GB. Os pesquisadores também usaram o pacote Code Carbon para mensurar a energia consumida e o carbono emitido durante a inferência.
Segundo o MIT Technology Review, o estudo ainda será revisado por pares. Mas você já pode conferir o preprint eletrônico no ArXiv.