ANÁLISIS DE FACTORES Y PREPARACIÓN DE DATOS DE METEOROLOGÍA Y CONTAMINANTES DE LA CIUDAD DE
Resumen
Este documento recoge todas las experiencias obtenidas con la base de datos tanto de meteorología, como de contaminantes en la ciudad de Valledupar, en el desarrollo de las tres primeras fases entendimiento del negocio, entendimiento de los datos y preparación de los datos, de la de la metodología CRISP-DM. Dicha metodología es propia para proyectos investigativos concerniente a técnicas de minería de datos,en la preparación de datos y modelaje. En esta investigación se aborda las experiencias alcanzadas con los registros de meteorología y monitoreos de contaminantes entre los años 2009 a 2012 en la Ciudad de Valledupar, donde se realiza detección de datos atípicos, formateo de tablas, limpieza total de atributos, normalización, integración de tablas y la construcción definitiva del conjunto de datos. Durante este proceso se extraen hipótesis preliminares, como que el contaminante PM10 casi exclusivamente presenta valores altos, cuando no existen precipitaciones. Otra hipótesis extraída en el análisis de los datos, son los valores bajos que toman los contaminantes de PM10 y CO cuando los vientos vienen del Norte, noreste y del este, indicando que los contaminantes al parecer son provenientes del resto direcciones. La base de datos de CORPOCESAR, presenta gran cantidad errores e inconsistencias, que se solucionan a cabalidad,usando programas especializados como Rapid Miner, Libre Office, SQL Yog, entre otros; dichos programas poseen diferentes técnicas de filtrado, reemplazo y métodos de detección de atributos atípicos, para así obtener un grupo de datos limpios prestos a su posterior utilización, para cualquier etapa posterior de modelaje. Este trabajo es avalado y patrocinado por el Ministerio TIC por medio del fondo de desarrollo de Talento Digital.
Citas
Barai, S. V et al. 2009. Air Quality Forecaster : Moving Window Based.
Applications of Soft Computing. E. Avineri et al., eds. Springer Berlin / Heidelberg. 137–145.
Barrón Adame, J.M. 2010. Modelado de un Sistema de Supervisión de la calidad del aire
usando técnicas de Fusión de Sensores y Redes Neuronales. Universidad politécnica de madrid.
Caselli, M. et al. 2008. A Simple Feedforward Neural Network for the PM10
Forecasting: Comparison with a Radial Basis Function Network and a Multivariate Linear Regression Model. Water, Air, and Soil Pollution. 201, 1-4 (Dec. 2008), 365–377.
Chapman, P. et al. 2000. CRISP-DM 1.0, Step-by-step data mining guide.
Hernández Orallo, J. et al. 2008. Introducción a la Minería de Datos. Pearson Prentice Hall.
información. XV Work Shop de Investigadores de Ciencias de la Computación (Parana - Entre Rios, 2013), 171–175. 21
Ingeniería Documentos de
Paschalidou, A.K. and Karakitsios, S. 2011. Forecasting hourly PM 10 concentration in
Cyprus through artificial neural networks and multiple regression models : implications to local
environmental management. Environmental Science and Pollution Research. 18, 2 (2011), 316–327.
Perez, P. et al. 2004. Carbon monoxide concentration forecasting in Santiago,
Chile. Journal of the Air & Waste Management Association (1995). 54, 8 (Aug. 2004), 908–13.
Perez, P. 2002. Prediction of maximum of 24-h average of PM10 concentrations 30
h in advance in Santiago, Chile. Atmospheric Environment. 36, (2002), 4555–4561.
Perez, P. and Reyes, J. 2006. An integrated neural network mo del for PM10 forecasting. Atmospheric Environment. 40, 16 (May. 2006), 2845–2851.
Pollo-Catteneo, M. et al. 2013. Prácticas y aplicaciones de ingeniería de requisitos en proyectos de explotación de
Prato, B.L. et al. 2013. Minería de Datos en Bio-Ciencias Resumen Contexto Introducción Resultados y
Objetivos. XI Workshop de Investigadores en Ciencias de la Computación (Parana - Entre Rios, 2013), 181–184.
Shekarrizfard, M. and Hadad, K. 2012. Wavelet transform-based artificial neural networks ( WT-ANN ) in PM 10 pollution level estimation , based on circular variables. Environmental Science and Pollution Research. 19, 1 (2012), 256–268.
Universidad Industrial de Santander - Corpocesar 2012. Informe De Operación Del Sistema
De Vigilancia De Calidad De Aire De La Ciudad De Valledupar, Departamento Del Cesar - Anual.
Universidad Industrial de Santander - Corpocesar 2012. Informe De Operación Del Sistema Especial De Vigilancia De Calidad De Aire En La Zona Carbonífera Del Departamento Del Cesar - Anual.
Voukantsis, D. et al. 2011. Intercomparison of air quality data using principal compo nent analysis, and forecasting of PM10 and PM2.5 concentrations using artificial neural
networks, in Thessaloniki and Helsinki. The Science of the total environment. 409, 7 (Mar. 2011), 1266–76.
Yeganeh, B. et al. 2012. Prediction of CO concentrations based on a hybrid Partial Least Square and Support Vector Machine model. Atmospheric Environment. 55, (Aug. 2012), 357–365.
Žabkar, J. et al. 2006. Prediction of ozone concentrations. Ecological Modeling. 191, 1 (Jan. 2006), 68–82.
Descargas
Publicado
Número
Sección
Licencia
Al presentar un artículo a consideración del comité de la revista DOCUMENTOS DE INGENIERÍA el autor acepta:
1. Que los juicios emitidos son de su entera responsabilidad, por ende, estos no comprometen las políticas de la universidad ni las del comité editorial.
2. Que no recibirá pago por la inclusión de su artículo en la publicación DOCUMENTOS DE INGENIERÍA.
3. Que el artículo presentado a consideración del comité editorial de la Revista Documentos de Ingeniería, no podrá presentarse a comités de otras publicaciones hasta obtener una respuesta escrita de la decisión tomada en relación con la aceptación o rechazo de su artículo por parte del comité editorial de la revista.
4. Que el artículo puesto a consideración del comité de la revista DOCUMENTOS DE INGENIERÍA, no ha sido publicado en ninguna otra parte en versiones sustancialmente iguales.
5. De publicarse, su artículo se convierte en propiedad permanente de la Facultad de INGENIERIAS y no podrá ser publicado en otro medio sin permiso escrito de su autor y de la Universidad.
6. Que los artículos a presentar a consideración del comité editorial de la Revista Documentos de Ingeniería deben ser de pertinencia nacional e internacional.