contêineres com equipamento para coleta de dados atmosféricos

Pesquisadores coletam diariamente, na Amazônia e em outras regiões brasileiras, milhares de dados sobre as condições da atmosfera, entre eles a concentração de material particulado e de gases, as propriedades de nuvens e os parâmetros meteorológicos como temperatura, umidade e velocidade dos ventos. Essas informações ajudam a entender, por exemplo, o impacto da poluição no clima e no ciclo hidrológico. Também permitem estimar como determinadas localidades serão afetadas pelas mudanças climáticas.

Boa parte dos dados gerados não é publicada e permanece inacessível à grande maioria dos cientistas. Com o objetivo de mudar esse panorama e de contribuir para a melhoria do sistema de ciência e tecnologia do país, a Universidade de São Paulo (USP), a Universidade Federal de São Paulo (Unifesp) e o Instituto Nacional de Pesquisas Espaciais (Inpe) firmaram um acordo com o Oak Ridge National Laboratory, do Departamento de Energia dos Estados Unidos. A instituição tem 27 anos de experiência na gestão de dados ambientais e atmosféricos.

A cooperação envolve a troca de conhecimento (compartilhamento de dados e softwares de código aberto) e o intercâmbio de pesquisadores para o aprendizado de técnicas e mecanismos de gerenciamento de dados, integração, compartilhamento, modelagem e visualização de dados. O tema foi debatido no 5º Workshop on Data Science – Challenges in Brazilian Context to Promote Atmospheric Data Management , realizado em fevereiro, na Escola Politécnica (Poli) da USP.

O acordo visa apoiar o desenvolvimento de um sistema e de serviços computacionais para que a gestão e a curadoria dos dados atmosféricos possam ser feitas nas instituições brasileiras, a começar pelas informações coletadas em projetos apoiados pela FAPESP, como a campanha científica GoAmazon (Green Ocean Amazon) e o projeto “O ciclo de vida de aerossóis e nuvens na Amazônia”, vinculado ao Programa FAPESP de Pesquisa sobre Mudanças Climáticas Globais (PFPMCG).

“Estima-se que mais de 80% dos dados atmosféricos coletados não são publicados. E, em geral, eles são obtidos com recursos públicos. São, portanto, dados públicos. Avançar na gestão desse conhecimento, disseminando-o e tornando-o acessível aos demais cientistas, é otimizar o uso dos recursos. Contribui ainda para o avanço da ciência, pois mais pesquisadores e a sociedade como um todo poderão ter acesso a essas valiosas informações”, disse Paulo Artaxo, pesquisador do Instituto de Física da Universidade de São Paulo (IF-USP) e membro da coordenação do PFPMCG.

A iniciativa tende a solucionar um gargalo importante na pesquisa como um todo. No mundo, há maior coleta do que análise de dados. Isso porque, enquanto o investimento em infraestrutura e o avanço tecnológico permitiram avançar nas formas de coleta, ainda é necessário muito tempo e capital humano para análises baseadas em big data. Esse é o foco do Grupo de Estudos, Pesquisa e Extensão em Big Data da Poli-USP, organizador do evento.

“A soberania do país está relacionada com a capacidade de gerir esses dados, fazer descobertas a partir deles e desenvolver uma infraestrutura brasileira. É importante criar essa competência. Nossa ciência atmosférica é muito avançada e é preciso também capacitação e infraestrutura para trabalhar com grandes volumes de dados atmosféricos, que permitam a gestão e a curadoria integrada, envolvendo desde a aquisição, o processamento, a publicação e até a análise das informações”, disse Pedro Luiz Pizzigatti Corrêa, professor do Departamento de Engenharia de Computação e Sistemas Digitais da Poli- USP e coordenador do acordo.

Segundo Corrêa, a formalização do convênio com o laboratório do Departamento de Energia dos Estados Unidos vai permitir que cientistas brasileiros possam aplicar o conhecimento de outras iniciativas de gestão de dados atmosféricos, além de se capacitar para desenvolver uma infraestrutura adequada ao cenário nacional. “O objetivo é trazer essa competência para o Brasil, gerando uma infraestrutura computacional adequada ao nosso ambiente de pesquisa e, ao mesmo tempo, formar pesquisadores capazes de gerir essa infraestrutura”, disse Corrêa.

De acordo com Artaxo, em todas as áreas da ciência é extremamente importante fazer o gerenciamento e a otimização do uso de dados e o acordo é um passo importante para facilitar o compartilhamento do conhecimento. “A quantidade de dados ambientais coletada atualmente é enorme e ferramentas de visualização e disponibilização de big data são absolutamente necessárias. São dados importantes, às vezes históricos, mas, por causa do grande volume, impossíveis de serem analisados e publicados por um único grupo de pesquisa ou pesquisador. Acabam sendo colocados na gaveta ou deixados no hard disk de um computador qualquer. Apesar de serem únicos, provavelmente estarão perdidos daqui a 10 ou 20 anos, com informações valiosas financiadas pelo Estado”, disse Artaxo, que também é membro do Painel Intergovernamental sobre Mudanças Climáticas (IPCC) da Organização das Nações Unidas (ONU).

A ideia é que, com a colaboração, os dados fiquem abertos para a população em geral acessar, assim como já acontece em plataformas como o Programa de Cálculo do Desflorestamento da Amazônia (Prodes) do Inpe, que traça o histórico dos últimos 30 anos de focos de desmatamento na Amazônia.

“O objetivo é integrar. Com a colaboração será possível agregar dados de diferentes naturezas: de emissão atmosférica, de mudanças climáticas, variáveis meteorológicas e de desmatamento. Assim, será possível, por exemplo, verificar em uma única plataforma se em um ano de muita poluição havia muito foco de queimada”, disse Luciana Varanda Rizzo, professora da Unifesp e integrante do GoAmazon.

Outra vantagem do projeto está em incentivar a interdisciplinaridade. “É muito dado para pouca gente trabalhar. Ao compartilhá-los, é possível que pesquisadores de outras áreas façam correlações, por exemplo, ajudando a identificar o impacto da poluição na população de uma determinada espécie”, disse Rizzo.

No acordo, o Atmospheric Radiation Measurement (ARM) – programa responsável pelo desenvolvimento de ferramentas computacionais do Oak Ridge National Laboratory – vai fornecer recursos para gestão, compartilhamento e visualização de dados atmosféricos para que pesquisadores da USP, Unifesp e Inpe possam operacionalizar um Centro de Gestão de Dados Atmosféricos, com grandes bancos de dados, sistemas de compartilhamento e de inteligência artificial para o melhor aproveitamento das informações coletadas.

Desde 2015, a maior parte dos dados do projeto GoAmazon é depositada no ARM. A outra parte está no repositório do Instituto Max Plank, na Alemanha. “Estamos trabalhando com a USP nos últimos cinco anos para o compartilhamento de dados, padrões de dados abertos e gerenciamento de dados. Nos próximos três anos, trabalharemos inicialmente no sentido de compartilhar conhecimento e desenvolver algumas ferramentas. O acordo que estamos desenvolvendo vai permitir também a mobilidade de alunos para a capacitação", disse Giri Prakash, diretor do Data Center do ARM.

Atualmente, o gerenciamento de dados dos projetos de pesquisa é feito exclusivamente pelo pesquisador. “Como hoje temos uma quantidade brutal de dados sendo coletada, nem todos os pesquisadores têm o conhecimento, a infraestrutura e o tempo necessário para disponibilizar esse material. Por isso, serão construídas ferramentas para facilitar o trabalho desses pesquisadores”, disse Artaxo.

Desde 2017, a FAPESP exige um Plano de Gestão de Dados entre os anexos obrigatórios de propostas submetidas, especificando quais dados serão produzidos e como serão gerenciados, compartilhados e preservados.

Maria Fernanda Ziegler
Agência FAPESP

Este texto foi originalmente publicado por Agência FAPESP de acordo com a licença Creative Commons CC-BY-NC-ND. Leia o original aqui.

Pin It