Summary: | La contaminación del aire se ha convertido en uno de los principales problemas
ambientales a nivel mundial debido a su afección tanto en el medio ambiente como en la
salud en general. Los gobiernos tanto nacionales como internacionales han implementado
esfuerzos para medir y controlar las emisiones de contaminantes al aire proveniente de
fuente antrópicas instalando redes de monitorización atmosférica. Sin embargo, no todas
las ciudades y países cuentan con estas herramientas de monitoreo. Por ello, el uso de
las imágenes satelitales ha ido tomando fuerza en los últimos años ya que nos permite
obtener información satelital de áreas que no cuentan con monitoreo terrestre y poder
utilizar estos datos para fines de control, prevención e investigación. Por medio de dicha
información podemos realizar análisis y modelado de las emisiones y comportamiento de
los contaminantes atmosféricos.
Debido a la necesidad de poder prevenir a la sociedad y tomar medidas preventivas de las
emisiones de contaminantes atmosféricos, la comunidad científica en los últimos años ha
propuesto diferentes modelos matemáticos y modelos de aprendizaje no supervisado que
permitan predecir las emisiones de los contaminantes atmosféricos. Para ello, es necesario
tomar en cuenta las variables externas que afectan al comportamiento de los
contaminantes dependiendo de la zona de estudio, ya que la ubicación geográfica, la
topografía, y condiciones meteorológicas influyen directa o indirectamente en este
comportamiento, por esta razón generalmente los investigadores diseñan modelos para
regiones específicas. No existe un método para establecer qué variables meteorológicas
deben ser usadas en la predicción de los contaminantes, los antecedentes a usar son los
estudios previos realizados, observando los resultados obtenidos para saber las influencias
de estas variables en el comportamiento de los contaminantes.
El presente trabajo propone dos modelos de predicción de la concentración de NO2 y SO2
para las tres ciudades más importantes del Ecuador Tomando como base la información
de imágenes satelitales Sentinel-5P, Giovanni NASA y ERA 5. El primer modelo propuesto
utiliza redes Neuronales Recurrentes utilizando el número de retrasos o variables ficticias
creadas que se utilizan para encontrar relaciones entre la concentración y las variables
meteorológicas, las cuales proporcionan información a la red neuronal para realizar la
Bryam Montesdeoca Jara
Dayana Ortiz Morocho ii
predicción. Se propuso predecir la contaminación atmosférica hasta 5 días hacia adelante
con el uso de diferentes estructuras buscando la mejor para el pronóstico. El segundo
modelo propuesto utiliza el método de Random Forest teniendo en cuenta dos
características importantes, la profundidad máxima de cada árbol y el número mínimo de
muestras para considerarse Nodos Hoja. Estas dos características nos dan dos
perspectivas acerca de los bosques aleatorios buscando el mejor modelo de predicción.
Se puede decir que la predicción a través del algoritmo de Regresión de Random Forest
fue el que mejor rendimiento R2=0,98 mostró y las métricas de error MAPE, RMSE y PBIAS
fueron más bajas en este método con valores de 7, 3,67, 0,68, respectivamente, haciendo
énfasis en los distintos conjuntos de datos, la predicción para la ciudad de Cuenca fue la
mejor seguida de la ciudad de Guayaquil que supera ligeramente a las predicciones de
Quito. Esto demuestra que la predicción de la calidad del aire es efectiva mostrando
resultados satisfactorios y abriendo puertas a nuevas investigaciones con la finalidad de
poder prever las medidas de concentraciones de gases contaminantes al aire y así poder
tomar decisiones preventivas tanto para la salud como el medio ambiente.
|