Ciencia de datos en la predicción del fenómeno climático de la helada, centrado en su intensidad, duración y alternativas de mitigación
Resumen
Las heladas son una de las problemáticas que afectan a los agroproductores y ocasionan grandes
pérdidas económicas. En este trabajo se plantea resolver el problema de la predicción de
ocurrencia de heladas, y sus características de intensidad y duración, utilizando métodos de
Ciencia de Datos. En torno a esto, se exploró y profundizó sobre los conceptos de Ciencia de
Datos y su proceso, Inteligencia Artificial (IA), Machine Learning (ML), Deep Learning (DL),
computación paralela y, por su puesto, el fenómeno climático de la helada.
Para el desarrollo de este trabajo, se utilizaron datos captados por sensores agro meteorológicos
dispuestos en dos estaciones meteorológicas ubicadas en la provincia de San Juan entre los años
2013 y 2019. Se utilizó el lenguaje de programación Python, con diferentes bibliotecas, así
como también Knime Analytics (KA) -Konstanz Information Miner- una plataforma de minería
de datos que permite el desarrollo de modelos en un entorno visual, para la limpieza,
procesamiento, modelado y visualización de los datos.
La predicción de ocurrencia de heladas, se realizó con la estrategia de ventanas de tiempo, la
cual fue abordada por algoritmos de Machine Learning y Deep Learning. Por otro lado, se
trabajó en las características de la helada, así como su ocurrencia, mediante agrupación por días
de los datos, y su predicción mediante algoritmos de Machine Learning.
Los algoritmos de Machine Learning utilizados fueron Random Forest, clasificador y regresor,
y regresión logística y lineal con diferentes hiperparámetros. Por otro lado, en cuanto a Deep
Learning se utilizaron redes neuronales FeedForward y LSTM (Long Short Term Memory, del
inglés Memoria de Corto-Largo Plazo), las cuales fueron comparadas tanto con métricas de
predicciones como en tiempos de ejecución, en CPU (Central Processing Unit) y GPU (Graphic
Processing Unit).
Se lograron buenos resultados prediciendo la ocurrencia de helada, en especial con Random
Forest y también mediante la estrategia de ventanas de tiempo con redes neuronales LSTM.
También se logró estimar la intensidad y duración de heladas antes de que estas ocurran, en
especial en sus categorías más severas. Se compararon los resultados en los tiempos de
ejecución trabajando redes neuronales sobre CPU y GPU y se encontró que existe una gran
reducción en los tiempos en caso de entrenar las redes neuronales sobre GPU.
Colecciones
- Informática [8]
El ítem tiene asociados los siguientes ficheros de licencia: