Por medio del método de redes neuronales artificiales –un sistema que simula las neuronas cerebrales– se podría saber el comportamiento futuro de los niveles de contaminación en Bogotá, lo que ayudaría a tomar mejores decisiones en política pública sobre el tema.

A esa conclusión llegó Sandra Mireya Fajardo González, magíster en Ingeniería de la Universidad Nacional de Colombia (UNAL), quien explica que la minería de datos es una rama de la estadística que busca entender patrones a partir de un volumen considerable de información.
Con base en esta modalidad, la investigadora diseñó un modelo de redes neuronales artificiales que permitiera establecer un pronóstico a partir de los datos recopilados por la Red de Monitoreo de Calidad del Aire de Bogotá (RMCAB).
“Las redes neuronales artificiales son un modelo matemático de procesamiento de información paralela distribuida; para hacerlo, estas ajustan la conexión interna del sistema de acuerdo con un gran número de nodos, representando el comportamiento de las variables”, explica la magíster.
Existen predictores que conforman una primera capa y los valores pronosticados que conforman una segunda capa. A cada predictor se le asigna un coeficiente llamado “peso”, el cual se selecciona dentro de la red neuronal usando algoritmos de aprendizaje.
Las salidas de los nodos en una capa se convierten en las entradas de la siguiente, y las entradas de cada nodo se componen usando una combinación lineal ponderada. Los resultados se modifican por una función no lineal antes de convertirse en salida, lo cual reduce el efecto de datos extremos.
Para desarrollar el sistema de pronóstico la magíster tomó datos de la RMCAB condensados entre 2005 y 2019 en la plataforma Envista Web, e hizo una limpieza de información, pues no todas las estaciones se instalaron al tiempo y existían vacíos, errores o reportes de banderas.
“Los reportes de banderas son identificadores o alertas generadas por los equipos de monitoreo, los técnicos de campo y el grupo de validación, incluidas dentro de la base de datos para detectar fácilmente aspectos que han interrumpido las condiciones adecuadas para llevar a cabo el correcto monitoreo de la calidad del aire, y por lo tanto invalidar inmediatamente la muestra tomada”, detalla la investigadora.
El estudio se enfocó en diferentes variables como concentración de materiales particulados PM10 y PM2,5 y dióxido de azufre (SO2); en algunas estaciones se incluyeron contaminantes atmosféricos. Estas variables fueron respectivamente la concentración promedio de los últimos 6 días y 3 días, y el ICA para el último día.
Con esto se esperaba que la concentración a pronosticar fuera la del día siguiente, por lo que la investigadora Fajardo reorganizó una matriz de datos para que cada día tuviera en su reporte el promedio de concentración de PM del siguiente día.
Los resultados mostraron una exactitud del 70 % para las 12 estaciones evaluadas, tanto para PM10 como PM2,5. En las estaciones de Carvajal y Kennedy –donde se registran mayores niveles de contaminación– se presentó la mayor cantidad de errores, mientras que, en otras, como San Cristóbal, Usaquén, MinAmbiente, Las Ferias y Guaymaral, la precisión fue superior o igual al 90 %.
Agencia de Noticias UN