Metodologia preenche lacuna ao calcular volume de chuvas
Pesquisa combina algoritmos e matemática aplicada para medir volume de precipitações
Metodologia preenche lacuna ao calcular volume de chuvas

Pesquisa combina algoritmos e matemática aplicada para medir volume de precipitações

Como calcular a quantidade de chuva em regiões nas quais não existem estações meteorológicas ou como fazer isso quando esses equipamentos falham? Esse foi o desafio enfrentado por Julia Tarifa em sua dissertação de mestrado, realizado junto ao Instituto de Matemática, Estatística e Computação Científica (Imecc) da Unicamp. Combinando matemática aplicada e algoritmos de inteligência artificial, a pesquisadora desenvolveu uma metodologia capaz de estimar dados de precipitação no Estado de São Paulo com precisão superior à dos dados coletados a partir de imagens de satélites, preenchendo lacunas importantes quando se tem em mente o planejamento agrícola no Brasil.
A inspiração para o trabalho veio do avô, geógrafo e especialista em climatologia. “Meu olho brilhava sempre que eu falava com meu avô sobre o trabalho dele. Acho que ele foi a minha inspiração”, revela a autora da dissertação.
O objetivo principal da pesquisa foi usar dados das estações meteorológicas e de satélites para estimar com maior precisão a quantidade de chuva em determinados locais. “Principalmente em lugares sem estação meteorológica ou em lugares cujos equipamentos encontram-se muito longe uns dos outros, deixando áreas sem estimativa”, explicou.
Tarifa buscou também corrigir erros em medições já realizadas pois muitas estações apresentaram falhas ou inconsistências a respeito dos dados coletados.
Quando iniciou seu mestrado, a pesquisadora procurou o professor Stanley Oliveira, que já trabalhava com dados de chuva e agricultura como integrante da Empresa Brasileira de Pesquisa Agropecuária (Embrapa). “Eu recebi uma ligação do coordenador da área de matemática aplicada, o professor Aurélio [Ribeiro Leite de Oliveira], dizendo: ‘Olha, eu tenho uma aluna que quer trabalhar com dados da agricultura’”, relembra Oliveira. Tarifa, então, cursou a disciplina do docente e, no trabalho final, nasceu o projeto que uniria dados meteorológicos e algoritmos inteligentes.


O primeiro passo consistiu em reunir e tratar os dados meteorológicos. A pesquisadora identificou desde erros muito evidentes até inconsistências mais sutis, como estações que passaram mais de um ano sem registrar nenhuma precipitação. O processo de limpeza mostrou-se essencial para garantir a qualidade dos dados usados na geração dos modelos.
Preparada a base, Tarifa partiu para o desenvolvimento dos modelos preditivos, utilizando dois algoritmos de aprendizado de máquina: o Random Forest, de uso já consolidado em pesquisas anteriores, e o XGBoosting, que apresentou um desempenho ligeiramente superior. Para contornar o desequilíbrio nos dados – pois havia muito mais dias sem chuva do que com chuva –, a cientista incorporou ao processo uma adaptação do algoritmo SmolteR, capaz de gerar dados sintéticos em intervalos de tempo marcados por poucos registros. Essa técnica ajudou a melhorar o desempenho do modelo no caso de ocorrências raras, como chuvas intensas.
Na fase de testes, a autora da pesquisa separou os dados em conjuntos de treinamento e validação. “Dividi as estações em clusters, sendo o número de clusters equivalente a 20% do total de estações. E aí, dentro de cada cluster, eu selecionei uma estação para ser a minha estação de teste”, contou. Isso permitiu avaliar a eficácia do modelo em contextos nos quais o algoritmo não tinha informações prévias. Os resultados superaram as expectativas. “Os resultados nos surpreenderam muito. Chegamos a previsões tão boas que superaram os produtos baseados em satélite”, afirmou Oliveira.
Desafios
Um dos primeiros desafios enfrentados por Tarifa surgiu ao precisar aprender programação, algo essencial para o avanço do projeto. Sem experiência prévia, a pesquisadora viu-se obrigada a dominar ferramentas de manipulação de dados. “Acho que o primeiro desafio real foi aprender programação, mexer com os dados, organizar e rodar o modelo”, disse.
Outro obstáculo: o desequilíbrio entre o número de dias com e o de dias sem chuva, algo que prejudicou o processo de aprendizado do algoritmo, levando a previsões incorretas. A solução envolveu o tratamento dos dados e a adaptação do algoritmo SmolteR. Além disso, a detecção de erros nos registros das estações meteorológicas exigiu atenção redobrada, já que nem sempre Tarifa conseguiu avaliar se as informações estavam corretas.


De acordo com o orientador, a pesquisa tem potencial de aplicação em políticas públicas, especialmente no setor agrícola. “O grande usuário desses modelos são empresas como a Embrapa, que trabalha com políticas públicas para desenvolver modelos de previsão de safra, modelos para estimar ou indicar quais são os melhores cultivares para determinadas regiões do Brasil”, afirmou Oliveira.
Seguradoras e bancos também podem se beneficiar da tecnologia, já que “todos os contratos têm uma base feita em cima de dados meteorológicos”, complementou o pesquisador. Para um produtor rural que busca um seguro agrícola ou financiamento, dispor de dados precisos sobre o regime de chuvas é fundamental para projetar eventuais perdas decorrentes de eventos climáticos.
Segundo Oliveira, a técnica desenvolvida permite criar o que chamou de “estações virtuais” para locais onde não há medidores físicos. “Essa estação virtual consegue fazer uma estimativa para a gente ter uma noção sobre se o sinistro dele faz sentido ou não”, explicou o orientador, referindo-se a produtores rurais que solicitam indenização por perdas causadas pela falta ou pelo excesso de chuva.
Concluído o mestrado, Tarifa agora acredita ser possível ampliar a pesquisa para incluir mais dados produzidos por satélites, o que melhoraria ainda mais as estimativas. “Quanto mais dados você tiver, melhores as estimativas, pressupõe-se”, disse Oliveira. Outro passo consistiria em aplicar o modelo em todo o território nacional.
Na avaliação do orientador, parte do trabalho de Tarifa já encontrará aplicação dentro em breve. “Temos interesse em aplicar [o modelo] na Embrapa. A gente diz que é muito bom terminar uma pós-graduação e publicar um paper. Mas é muito bom quando a pesquisa não fica só no paper”, afirmou.