ANÁLISIS DE FACTORES Y PREPARACIÓN DE DATOS DE METEOROLOGÍA Y CONTAMINANTES DE LA CIUDAD DE

Autores/as

  • Jhon Jairo Anaya Diaz Universidad Popular del Cesar.
  • Fabio González Universidad Nacional de Colombia

Resumen

Este documento recoge todas las experiencias obtenidas con la base de datos tanto de meteorología, como de contaminantes en la ciudad de Valledupar, en el desarrollo de las tres primeras fases entendimiento del negocio, entendimiento de los datos y preparación de los datos, de la de la metodología CRISP-DM. Dicha metodología es propia para proyectos investigativos concerniente a técnicas de minería de datos,en la preparación de datos y modelaje. En esta investigación se aborda las experiencias alcanzadas con los registros de meteorología y monitoreos de contaminantes entre los años 2009 a 2012 en la Ciudad de Valledupar, donde se realiza detección de datos atípicos, formateo de tablas, limpieza total de atributos, normalización, integración de tablas y la construcción definitiva del conjunto de datos. Durante este proceso se extraen hipótesis preliminares, como que el contaminante PM10 casi exclusivamente presenta valores altos, cuando no existen precipitaciones. Otra hipótesis extraída en el análisis de los datos, son los valores bajos que toman los contaminantes de PM10 y CO cuando los vientos vienen del Norte, noreste y del este, indicando que los contaminantes al parecer son provenientes del resto direcciones. La base de datos de CORPOCESAR, presenta gran cantidad errores e inconsistencias, que se solucionan a cabalidad,usando programas especializados como Rapid Miner, Libre Office, SQL Yog, entre otros; dichos programas poseen diferentes técnicas de filtrado, reemplazo y métodos de detección de atributos atípicos, para así obtener un grupo de datos limpios prestos a su posterior utilización, para cualquier etapa posterior de modelaje. Este trabajo es avalado y patrocinado por el Ministerio TIC por medio del fondo de desarrollo de Talento Digital.

Biografía del autor/a

Jhon Jairo Anaya Diaz, Universidad Popular del Cesar.

Ingeniero Electrónico. Profesor Universidad Popular del Cesar. Magister (C) en Ingeniería de Sistemas y
Computación. Valledupar, Colombia. Universidad Nacional de Colombia, Bogotá
Departamento de Ingeniería de Sistemas e Industrial

Fabio González, Universidad Nacional de Colombia

PhD & MsC. FABIO GONZÁLEZ. Profesor Asociado. Universidad Nacional de Colombia, Bogotá
Departamento de Ingeniería de Sistemas e Industrial

Citas

Barai, S. V et al. 2009. Air Quality Forecaster : Moving Window Based.

Applications of Soft Computing. E. Avineri et al., eds. Springer Berlin / Heidelberg. 137–145.

Barrón Adame, J.M. 2010. Modelado de un Sistema de Supervisión de la calidad del aire

usando técnicas de Fusión de Sensores y Redes Neuronales. Universidad politécnica de madrid.

Caselli, M. et al. 2008. A Simple Feedforward Neural Network for the PM10

Forecasting: Comparison with a Radial Basis Function Network and a Multivariate Linear Regression Model. Water, Air, and Soil Pollution. 201, 1-4 (Dec. 2008), 365–377.

Chapman, P. et al. 2000. CRISP-DM 1.0, Step-by-step data mining guide.

Hernández Orallo, J. et al. 2008. Introducción a la Minería de Datos. Pearson Prentice Hall.

información. XV Work Shop de Investigadores de Ciencias de la Computación (Parana - Entre Rios, 2013), 171–175. 21

Ingeniería Documentos de

Paschalidou, A.K. and Karakitsios, S. 2011. Forecasting hourly PM 10 concentration in

Cyprus through artificial neural networks and multiple regression models : implications to local

environmental management. Environmental Science and Pollution Research. 18, 2 (2011), 316–327.

Perez, P. et al. 2004. Carbon monoxide concentration forecasting in Santiago,

Chile. Journal of the Air & Waste Management Association (1995). 54, 8 (Aug. 2004), 908–13.

Perez, P. 2002. Prediction of maximum of 24-h average of PM10 concentrations 30

h in advance in Santiago, Chile. Atmospheric Environment. 36, (2002), 4555–4561.

Perez, P. and Reyes, J. 2006. An integrated neural network mo del for PM10 forecasting. Atmospheric Environment. 40, 16 (May. 2006), 2845–2851.

Pollo-Catteneo, M. et al. 2013. Prácticas y aplicaciones de ingeniería de requisitos en proyectos de explotación de

Prato, B.L. et al. 2013. Minería de Datos en Bio-Ciencias Resumen Contexto Introducción Resultados y

Objetivos. XI Workshop de Investigadores en Ciencias de la Computación (Parana - Entre Rios, 2013), 181–184.

Shekarrizfard, M. and Hadad, K. 2012. Wavelet transform-based artificial neural networks ( WT-ANN ) in PM 10 pollution level estimation , based on circular variables. Environmental Science and Pollution Research. 19, 1 (2012), 256–268.

Universidad Industrial de Santander - Corpocesar 2012. Informe De Operación Del Sistema

De Vigilancia De Calidad De Aire De La Ciudad De Valledupar, Departamento Del Cesar - Anual.

Universidad Industrial de Santander - Corpocesar 2012. Informe De Operación Del Sistema Especial De Vigilancia De Calidad De Aire En La Zona Carbonífera Del Departamento Del Cesar - Anual.

Voukantsis, D. et al. 2011. Intercomparison of air quality data using principal compo nent analysis, and forecasting of PM10 and PM2.5 concentrations using artificial neural

networks, in Thessaloniki and Helsinki. The Science of the total environment. 409, 7 (Mar. 2011), 1266–76.

Yeganeh, B. et al. 2012. Prediction of CO concentrations based on a hybrid Partial Least Square and Support Vector Machine model. Atmospheric Environment. 55, (Aug. 2012), 357–365.

Žabkar, J. et al. 2006. Prediction of ozone concentrations. Ecological Modeling. 191, 1 (Jan. 2006), 68–82.

Descargas

Publicado

2014-07-02