Diseño de una arquitectura de datos masivos para el mapeo geográfico de la contaminación del aire en el DMQ entre los años 2005 al 2020.

Mora Villacís, María Gabriela

Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/23602

Título:	Diseño de una arquitectura de datos masivos para el mapeo geográfico de la contaminación del aire en el DMQ entre los años 2005 al 2020.
Autor:	Mora Villacís, María Gabriela
Palabras clave:	SISTEMA DE INFORMACIÓN TELEMÁTICA GEO-COMPUTACIONAL PARALELA ARQUITECTURA DE BIG DATA CONTAMINACIÓN DEL AIRE MAPEO GEOGRÁFICO
Fecha de publicación:	ene-2023
Editorial:	Quito : EPN, 2023.
Citación:	Mora Villacís, M.G. (2023). Diseño de una arquitectura de datos masivos para el mapeo geográfico de la contaminación del aire en el DMQ entre los años 2005 al 2020. 58 páginas. Quito : EPN.
Resumen:	The aim of this research is to integrate the processing and visualization of geographic data related to air pollution, within a massive data architecture. To achieve it, air pollutant data from Quito, Ecuador were used; it is measured by Atmospheric Monitoring Network of the city and were expressed by an index. The proposed architecture is open-source and is made up of a master node and two workers: it consists of a unified analysis computational system in Spark, managed by Yarn and linked to a graphical interface provided by Zeppelin; which stores data in HDFS, processes it and displays it visually through geographic maps. To measure its efficiency, a response time comparison was made with and without the system. Without its use, geographic interpolation took 4.52 seconds; while the proposed system showed an execution time of 2.0 seconds, obtaining a reduction of 56%. This shows an improvement in the traditional interpolation and map visualization processes and generating a new open-source alternative with resources and time optimization; in addition to contribute to making strategic decisions through a new way of analyzing environmental problems.
Descripción:	Este trabajo de investigación tiene el propósito de integrar el procesamiento y visualización de datos geográficos relacionados a contaminación del aire, dentro de una arquitectura de datos masivos. Para alcanzarlo, se utilizaron datos de contaminantes atmosféricos de la ciudad de Quito, medidos a lo largo de la Red de Monitoreo Atmosférico, los cuales se expresaron mediante un índice. La arquitectura propuesta es open-source y se compone de un nodo máster y 2 workers, que consiste en un sistema computacional de análisis unificado en Spark, administrado por Yarn y enlazado a una interfaz gráfica proporcionada por Zeppelin; mismo que almacena los datos en HDFS, los procesa y los muestra visualmente mediante mapas geográficos. Para medir su eficiencia, se realizó una comparativa de tiempos de respuesta con y sin el empleo del sistema. Sin su uso, el proceso de interpolación geográfica tomó un tiempo de 4.52 segundos; mientras que el sistema propuesto mostró un tiempo de ejecución de 2.0 segundos, obteniendo una reducción del 56%, mejorando así el camino tradicional de interpolación y visualización de mapas y generando una nueva alternativa open-source con optimización de recursos y tiempo, además de contribuir en la toma de decisiones estratégicas mediante una nueva forma de análisis las problemáticas ambientales.
URI:	http://bibdigital.epn.edu.ec/handle/15000/23602
Tipo:	masterThesis
Aparece en las colecciones:	Tesis MAESTRÍA EN SISTEMAS DE INFORMACIÓN MENCIÓN INTELIGENCIA DE NEGOCIOS Y ANALÍTICA DE DATOS MASIVOS (FIS)

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
CD 12925.pdf		3,83 MB	Adobe PDF	Visualizar/Abrir

Muestra el registro Dublin Core completo del ítem

BIBDIGITAL