Aplicação de modelos de Machine Learning para previsão de casos de dengue e classificação de risco epidêmico na região sul do brasil

Autores

DOI:

https://doi.org/10.70185/2525-6025.2025.v10.519

Palavras-chave:

Machine learning. Tecnologia. Dengue. Saúde.

Resumo

A dengue é uma doença infecciosa com forte impacto na saúde pública brasileira, em que a incidência está diretamente relacionada a fatores ambientais, climáticos e populacionais. A previsão de surtos ainda representa um grande desafio, mas avanços na área de ciência de dados vêm possibilitando novas abordagens preditivas. Dentre essas, destacam-se os modelos de aprendizado de máquina, que se mostram eficazes na identificação de padrões complexos e no suporte à tomada de decisões estratégicas em saúde pública. Este trabalho tem como objetivo desenvolver, avaliar e comparar diferentes modelos de aprendizado de máquina na previsão de surtos de dengue na Região Sul do Brasil, com base em dados epidemiológicos e variáveis complementares, como clima (temperatura, umidade, precipitação) e características populacionais (densidade, distribuição etária e urbana/rural). A metodologia adotada incluiu o tratamento, normalização e integração de diferentes bases de dados, a criação de variáveis derivadas (como proporções e defasagens temporais), a aplicação de modelos supervisionados de regressão e a análise comparativa de desempenho por meio de métricas como erro absoluto médio, raiz do erro quadrático e coeficiente de determinação. Além disso, os resultados também foram avaliados sob a ótica de classificação de risco, com base em faixas de incidência de casos de dengue por município e semana epidemiológica, aplicando métricas como acurácia, precisão, recall e F1-Score. Os resultados apresentaram diferenças significativas entre os modelos testados. O XGBoost por exemplo, foi o que apresentou melhor desempenho geral, com baixo erro médio (MAE = 7,06) e alta capacidade de entendimento dos dados (R² = 0,94), além de uma boa performance na classificação de risco (acurácia = 0,926; F1-score = 0,839). Da mesma forma, a Floresta Aleatória também obteve bons resultados, com um equilíbrio entre erro e acurácia (MAE = 7,80; R² = 0,93; acurácia = 0,933; F1-score = 0,855). Já modelos mais simples, como Regressão Linear e Árvore de Decisão, tiveram desempenho inferior. Conclui-se que a modelagem preditiva, quando bem fundamentada e contextualizada, pode ser uma ferramenta valiosa no enfrentamento de doenças sazonais como a dengue.

Downloads

Publicado

2026-05-22

Edição

Seção

Engenharias e Tecnologias

Como Citar

Aplicação de modelos de Machine Learning para previsão de casos de dengue e classificação de risco epidêmico na região sul do brasil. Revista Vincci - Periódico Científico do UniSATC, [S. l.], v. 10, n. 2, p. 161–187, 2026. DOI: 10.70185/2525-6025.2025.v10.519. Disponível em: https://revistavincci.satc.edu.br/index.php/Revista-Vincci/article/view/519. Acesso em: 23 maio. 2026.