NASA desenvolve IA de monitoramento ambiental com pesquisadora brasileira
Hoje a NASA tem 70 petabytes de dados sobre a Terra. Até 2030, a agência espacial pode alcançar os 600 petabytes com o lançamento recente do satélite SWOT e de outras missões que observarão o planeta lá de cima – como a NISAR, prevista para 2024.
Pode ser uma quantidade difícil de visualizar. Veja só: um petabyte (PB) equivale a mil terabytes e um chorinho, que por sua vez equivale a mil gigabytes e um chorinho. Para produzir um PB de dados, você deveria tirar mais de 4 mil fotos digitais todos os dias da sua vida, ou produzir 500 bilhões de páginas de texto impresso.
A quantidade brutal de bytes da NASA é um amontoado de informação sobre a superfície e atmosfera do planeta. E a mágica é que estes dados são muito úteis para que os cientistas acompanhem as mudanças climáticas e descubram como podemos nos adaptar aos novos cenários.
Parte destes dados vem do Harmonized Landsat Sentinel-2 (HLS). O projeto combina os satélites Landsat da ESA (Agência Espacial Europeia), os satélites Sentinel da NASA, e faz novas observações da Terra a cada três dias. Estes dados já são disponíveis ao público. Mas estão crus: precisam de um processamento para se tornarem informações legíveis.
Então, a NASA estabeleceu uma parceria com a IBM, anunciada em fevereiro, para desenvolver e disponibilizar um modelo computacional que prepare estes dados de sensoriamento remoto – e facilite a criação de outros aplicativos de inteligência artificial (IA). Pesquisadores do mundo inteiro compõem a equipe do projeto, inclusive a brasileira Bianca Zadrozny, cientista da computação do Rio de Janeiro.
Modelos fundacionais
Bianca Zadrozny, que é gerente sênior de pesquisa da IBM Research Brasil, contou sobre o andamento do projeto durante o Colóquio de 2023 da IBM, que aconteceu em junho na sede da empresa, em São Paulo.
Antes de falarmos sobre a IA em desenvolvimento, é preciso entender que ela é um modelo fundacional – foundation model, em inglês, um termo popularizado pelo Stanford Institute for Human-Centered Artificial Intelligence, nos Estados Unidos.
Um modelo funcional é um modelo base, treinado com um amplo conjunto de dados não rotulados, que pode ser usado para diferentes tarefas com pouco de ajuste fino (ou fine tuning, como os cientistas da computação costumam chamar).
Uma explicação bem-vinda para os leigos no assunto: para desenvolver um aplicativo, você precisa de um conjunto de dados grande e bem rotulado. Isso significa que, no caso de imagens de satélites da Terra, uma equipe de pessoas vai inserir rótulos indicando, por exemplo, onde há um incêndio, uma enchente e por aí vai.
Treinamento
Então, treina-se o modelo para reconhecer tudo no conjunto de dados com as devidas anotações. Aí, sim, os desenvolvedores podem aplicá-lo ao caso que têm em mente – de reconhecimento de linguagem à geração de novas moléculas para desenvolver novos medicamentos.
Mas estas IAs projetadas para casos específicos estão dando lugar aos modelos fundacionais, uma IA que aprende de forma mais geral. A ideia, como explicaram os pesquisadores da IBM no colóquio, é acumular conhecimento em um modelo. Depois, disponibilizá-lo para a criação de outros aplicativos a partir dele.
“A beleza dos modelos fundacionais é que eles podem ser usados para muitas aplicações”, disse Rahul Ramachandran, cientista sênior de pesquisa do Marshall Space Flight Center (NASA), em comunicado. “Você só precisa de algumas amostras para ajustar o modelo e fazer previsões com a mesma precisão de outro construído com grandes quantidades de dados rotulados manualmente.”
Bianca Zadrozny explicou que a ideia da IA em desenvolvimento é criar um modelo-base para otimizar o desenvolvimento de aplicativos de monitoramento ambiental. Isso permitirá economizar centenas de horas de processamento de dados que envolve anotação manual.
Da NASA para o mundo
Há pouco tempo, a equipe de pesquisadores tentou verificar se, criando um modelo com os dados globais do HLS, era possível especializá-lo em algumas tarefas. Por enquanto, houve bons resultados, contou Bianca.
Eles usaram o modelo para identificar enchentes no Paquistão, por exemplo, em imagens de satélite que não foram usadas para treinar o modelo. Também já rolou um processo parecido para incêndios nos Estados Unidos.
A pesquisadora revelou que a NASA deve disponibilizar o modelo em outubro, para que outras pessoas desenvolvam aplicativos para monitoramento ambiental a partir desta base. Em paralelo, os pesquisadores devem continuar desenvolvendo versões do modelo com outras bases de dados.
Bianca faz parte de um time global que inclui pessoas dos EUA, da Índia, do Japão e de outros países. Por isso, por enquanto os pesquisadores estão focados em trabalhar com os dados sem fazer coisas muito específicas de uma ou outra região. Mas eles estão abertos a fazer parcerias.
Em entrevista ao Giz Brasil, Bianca contou que o modelo poderia otimizar o desenvolvimento de aplicativos para monitoramento ambiental no Brasil, a partir de parcerias “que estão no campo das ideias, porque o projeto ainda é muito recente”.
As possíveis parcerias poderiam acontecer com o INPE (Instituto Nacional de Pesquisas Espaciais), por exemplo. Outra possibilidade é o AgriBio, um grupo do Centro de Inteligência Artificial, uma parceria de USP, Fapesp e IBM, que estuda desenvolvimento tecnológico aplicado ao agronegócio sustentável.