Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/25093
Registro completo de metadatos
Campo DCValorLengua/Idioma
dc.contributor.authorChuga Portilla, Hernán Alexis-
dc.contributor.editorMartínez Mosquera, Silvia Diana-
dc.date.accessioned2023-11-15T20:54:21Z-
dc.date.available2023-11-15T20:54:21Z-
dc.date.issued2023-08-
dc.identifier.citationChuga Portilla, H.A. (2023). Implementación de computación en la nube en el laboratorio ADA de la Facultad de Sistemas para analítica de datos : implementación de un lago de datos en los servidores del laboratorio ADA. 79 páginas. Quito : EPN.es_ES
dc.identifier.otherT-IS 1786/CD 13610-
dc.identifier.urihttp://bibdigital.epn.edu.ec/handle/15000/25093-
dc.descriptionEn este proyecto, se llevó a cabo el proceso de diseño e implementación de un lago de datos con Hadoop en un clúster con un nodo maestro y cuatro nodos esclavos utilizando contenedores Docker. Se comenzó con una investigación y análisis de los requerimientos y objetivos del proyecto, centrándose en la importancia de la arquitectura y su adaptación a los recursos del servidor de altas prestaciones del laboratorio ADA. Para lograr una implementación exitosa, se realizó una experimentación previa con diferentes configuraciones y herramientas, lo que permitió entender el funcionamiento de Hadoop y Docker, así como sus interacciones. Se diseñó la arquitectura del lago de datos, incluyendo el NameNode, ResourceManager y los DataNodes coexistiendo en un solo contenedor con sus NodeManagers para mejorar la eficiencia y la utilización de recursos. El proceso de guardar datos en el lago de datos se realizó mediante la ejecución de scripts de análisis de datos de los usuarios finales del laboratorio ADA, verificando la división en bloques y su replicación en los DataNodes para garantizar tolerancia a fallos y alta disponibilidad. Se comprobó el funcionamiento de la red interna, el NameNode, el ResourceManager y los DataNodes mediante el acceso a sus interfaces web y verificando que todos los contenedores estuvieran correctamente conectados. El proyectó culminó con la implementación exitosa de un lago de datos, cumpliendo los objetivos y requerimientos planteados, y, cuya arquitectura fue probada y validada por los usuarios finales pertenecientes al laboratorio ADA"es_ES
dc.description.abstractIn this project, the process of designing and implementing a data lake with Hadoop was carried out in a cluster with one master node and four slave nodes using Docker containers. It began with an investigation and analysis of the requirements and objectives of the project, focusing on the importance of the architecture and its adaptation to the resources of the high-performance server of the ADA laboratory. To achieve a successful implementation, a previous experimentation with different configurations and tools was carried out, which allowed understanding the operation of Hadoop and Docker, as well as their interactions. The data lake architecture was designed, including the NameNode, ResourceManager and DataNodes coexisting in a single container with their NodeManagers to improve efficiency and resource utilization. The process of saving data in the data lake was carried out by executing data analysis scripts from the end users of the ADA laboratory, verifying the division into blocks and their replication in the DataNodes to guarantee fault tolerance and high availability. The operation of the internal network, the NameNode, the ResourceManager and the DataNodes was verified by accessing their web interfaces and verifying that all the containers were correctly connected. The project culminated in the successful implementation of a data lake, meeting the objectives and requirements set, and whose architecture was tested and validated by end users belonging to the ADA laboratory.es_ES
dc.language.isospaes_ES
dc.publisherQuito : EPN, 2023.es_ES
dc.rightsopenAccesses_ES
dc.subjectORDENADORes_ES
dc.subjectCOMPUTACIÓN EN LA NUBEes_ES
dc.subjectLAGO DE DATOSes_ES
dc.subjectHADOOPes_ES
dc.subjectDOCKERes_ES
dc.subjectLMACENAMIENTO DE DATOSes_ES
dc.titleImplementación de computación en la nube en el laboratorio ADA de la Facultad de Sistemas para analítica de datos : implementación de un lago de datos en los servidores del laboratorio ADA.es_ES
dc.typeTrabajo de Integración Curriculares_ES
Aparece en las colecciones:TIC - Ingeniería en Ciencias de la Computación

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD 13610.pdf2,23 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.