Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/25093
Título: Implementación de computación en la nube en el laboratorio ADA de la Facultad de Sistemas para analítica de datos : implementación de un lago de datos en los servidores del laboratorio ADA.
Autor: Chuga Portilla, Hernán Alexis
Director: Martínez Mosquera, Silvia Diana
Palabras clave: ORDENADOR
COMPUTACIÓN EN LA NUBE
LAGO DE DATOS
HADOOP
DOCKER
LMACENAMIENTO DE DATOS
Fecha de publicación: ago-2023
Editorial: Quito : EPN, 2023.
Citación: Chuga Portilla, H.A. (2023). Implementación de computación en la nube en el laboratorio ADA de la Facultad de Sistemas para analítica de datos : implementación de un lago de datos en los servidores del laboratorio ADA. 79 páginas. Quito : EPN.
Resumen: In this project, the process of designing and implementing a data lake with Hadoop was carried out in a cluster with one master node and four slave nodes using Docker containers. It began with an investigation and analysis of the requirements and objectives of the project, focusing on the importance of the architecture and its adaptation to the resources of the high-performance server of the ADA laboratory. To achieve a successful implementation, a previous experimentation with different configurations and tools was carried out, which allowed understanding the operation of Hadoop and Docker, as well as their interactions. The data lake architecture was designed, including the NameNode, ResourceManager and DataNodes coexisting in a single container with their NodeManagers to improve efficiency and resource utilization. The process of saving data in the data lake was carried out by executing data analysis scripts from the end users of the ADA laboratory, verifying the division into blocks and their replication in the DataNodes to guarantee fault tolerance and high availability. The operation of the internal network, the NameNode, the ResourceManager and the DataNodes was verified by accessing their web interfaces and verifying that all the containers were correctly connected. The project culminated in the successful implementation of a data lake, meeting the objectives and requirements set, and whose architecture was tested and validated by end users belonging to the ADA laboratory.
Descripción: En este proyecto, se llevó a cabo el proceso de diseño e implementación de un lago de datos con Hadoop en un clúster con un nodo maestro y cuatro nodos esclavos utilizando contenedores Docker. Se comenzó con una investigación y análisis de los requerimientos y objetivos del proyecto, centrándose en la importancia de la arquitectura y su adaptación a los recursos del servidor de altas prestaciones del laboratorio ADA. Para lograr una implementación exitosa, se realizó una experimentación previa con diferentes configuraciones y herramientas, lo que permitió entender el funcionamiento de Hadoop y Docker, así como sus interacciones. Se diseñó la arquitectura del lago de datos, incluyendo el NameNode, ResourceManager y los DataNodes coexistiendo en un solo contenedor con sus NodeManagers para mejorar la eficiencia y la utilización de recursos. El proceso de guardar datos en el lago de datos se realizó mediante la ejecución de scripts de análisis de datos de los usuarios finales del laboratorio ADA, verificando la división en bloques y su replicación en los DataNodes para garantizar tolerancia a fallos y alta disponibilidad. Se comprobó el funcionamiento de la red interna, el NameNode, el ResourceManager y los DataNodes mediante el acceso a sus interfaces web y verificando que todos los contenedores estuvieran correctamente conectados. El proyectó culminó con la implementación exitosa de un lago de datos, cumpliendo los objetivos y requerimientos planteados, y, cuya arquitectura fue probada y validada por los usuarios finales pertenecientes al laboratorio ADA"
URI: http://bibdigital.epn.edu.ec/handle/15000/25093
Tipo: Trabajo de Integración Curricular
Aparece en las colecciones:TIC - Ingeniería en Ciencias de la Computación

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD 13610.pdf2,23 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.