Implementación de computación en la nube en el laboratorio ADA de la Facultad de Sistemas para analítica de datos : implementación de un lago de datos en los servidores del laboratorio ADA.

Chuga Portilla, Hernán Alexis

Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/25093

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.author	Chuga Portilla, Hernán Alexis	-
dc.contributor.editor	Martínez Mosquera, Silvia Diana	-
dc.date.accessioned	2023-11-15T20:54:21Z	-
dc.date.available	2023-11-15T20:54:21Z	-
dc.date.issued	2023-08	-
dc.identifier.citation	Chuga Portilla, H.A. (2023). Implementación de computación en la nube en el laboratorio ADA de la Facultad de Sistemas para analítica de datos : implementación de un lago de datos en los servidores del laboratorio ADA. 79 páginas. Quito : EPN.	es_ES
dc.identifier.other	T-IS 1786/CD 13610	-
dc.identifier.uri	http://bibdigital.epn.edu.ec/handle/15000/25093	-
dc.description	En este proyecto, se llevó a cabo el proceso de diseño e implementación de un lago de datos con Hadoop en un clúster con un nodo maestro y cuatro nodos esclavos utilizando contenedores Docker. Se comenzó con una investigación y análisis de los requerimientos y objetivos del proyecto, centrándose en la importancia de la arquitectura y su adaptación a los recursos del servidor de altas prestaciones del laboratorio ADA. Para lograr una implementación exitosa, se realizó una experimentación previa con diferentes configuraciones y herramientas, lo que permitió entender el funcionamiento de Hadoop y Docker, así como sus interacciones. Se diseñó la arquitectura del lago de datos, incluyendo el NameNode, ResourceManager y los DataNodes coexistiendo en un solo contenedor con sus NodeManagers para mejorar la eficiencia y la utilización de recursos. El proceso de guardar datos en el lago de datos se realizó mediante la ejecución de scripts de análisis de datos de los usuarios finales del laboratorio ADA, verificando la división en bloques y su replicación en los DataNodes para garantizar tolerancia a fallos y alta disponibilidad. Se comprobó el funcionamiento de la red interna, el NameNode, el ResourceManager y los DataNodes mediante el acceso a sus interfaces web y verificando que todos los contenedores estuvieran correctamente conectados. El proyectó culminó con la implementación exitosa de un lago de datos, cumpliendo los objetivos y requerimientos planteados, y, cuya arquitectura fue probada y validada por los usuarios finales pertenecientes al laboratorio ADA"	es_ES
dc.description.abstract	In this project, the process of designing and implementing a data lake with Hadoop was carried out in a cluster with one master node and four slave nodes using Docker containers. It began with an investigation and analysis of the requirements and objectives of the project, focusing on the importance of the architecture and its adaptation to the resources of the high-performance server of the ADA laboratory. To achieve a successful implementation, a previous experimentation with different configurations and tools was carried out, which allowed understanding the operation of Hadoop and Docker, as well as their interactions. The data lake architecture was designed, including the NameNode, ResourceManager and DataNodes coexisting in a single container with their NodeManagers to improve efficiency and resource utilization. The process of saving data in the data lake was carried out by executing data analysis scripts from the end users of the ADA laboratory, verifying the division into blocks and their replication in the DataNodes to guarantee fault tolerance and high availability. The operation of the internal network, the NameNode, the ResourceManager and the DataNodes was verified by accessing their web interfaces and verifying that all the containers were correctly connected. The project culminated in the successful implementation of a data lake, meeting the objectives and requirements set, and whose architecture was tested and validated by end users belonging to the ADA laboratory.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Quito : EPN, 2023.	es_ES
dc.rights	openAccess	es_ES
dc.subject	ORDENADOR	es_ES
dc.subject	COMPUTACIÓN EN LA NUBE	es_ES
dc.subject	LAGO DE DATOS	es_ES
dc.subject	HADOOP	es_ES
dc.subject	DOCKER	es_ES
dc.subject	LMACENAMIENTO DE DATOS	es_ES
dc.title	Implementación de computación en la nube en el laboratorio ADA de la Facultad de Sistemas para analítica de datos : implementación de un lago de datos en los servidores del laboratorio ADA.	es_ES
dc.type	Trabajo de Integración Curricular	es_ES
Aparece en las colecciones:	TIC - Ingeniería en Ciencias de la Computación

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
CD 13610.pdf		2,23 MB	Adobe PDF	Visualizar/Abrir

Muestra el registro sencillo del ítem

BIBDIGITAL