Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/19608
Título: Desarrollo y evaluación de rendimiento de una aplicación para el análisis de ADN utilizando Hadoop
Autor: Paucar López, Juan Carlos
Palabras clave: BIOINFORMÁTICA
COMPUTACIÓN DISTRIBUIDA
REDES DE INFORMACION
HADOOP
Fecha de publicación: 30-jul-2018
Editorial: Quito, 2018.
Citación: Paucar López, J. C. (2018). Desarrollo y evaluación de rendimiento de una aplicación para el análisis de ADN utilizando Hadoop. 130 hojas. Quito : EPN.
Resumen: The present project consists of the development of an application for the processing of the annotation phase during the genetic analysis. The application is designed to take advantage of the lower cost of processing data in the cloud. The project starts with the development of a library for efficient processing of VCF files containing the variations noted during previous phases in DNA analysis. Then, an application is developed for the Hadoop framework which implements the MapReduce programming model. MapReduce trivializes, to a great extent, the processing of enormous amounts of data as it is the information with genetic variations of the human being. Both the library and the application will be developed using the Haskell programming language, which by language construction and under the functional programming paradigm, allows an efficient manipulation of resources for data processing. Subsequently, the performance of the application is evaluated to generate a predictive model of performance to be able to use said model to estimate the execution time of the application under different environments and conditions. This model and the characterization of the computational performance allows the comparison with other existing solutions.
Descripción: El presente proyecto trata acerca del desarrollo de una aplicación para el procesamiento de la fase de anotación durante el análisis genético. La aplicación está planteada para que pueda tomar ventaja del abaratamiento del costo de procesamiento de datos en la nube. Para esto se parte del desarrollo de una librería para el procesamiento eficiente de archivos VCF que contienen las variaciones anotadas durante fases previas en el análisis de ADN. Entonces se desarrolla una aplicación para el framework Hadoop que implementa el modelo de programación MapReduce. MapReduce permite trivializar, en gran medida, el procesamiento de enormes cantidades de datos como lo es la información con variaciones genéticas del ser humano. Tanto la librería como la aplicación serán desarrolladas usando en lenguaje de programación Haskell, que por construcción del lenguaje y bajo el paradigma de programación funcional, permite una manipulación eficiente de los recursos para el procesamiento de los datos. Posteriormente, se evalúa el desempeño de la aplicación para generar un modelo predictivo de rendimiento y poder usar dicho modelo para estimar el tiempo de ejecución de la aplicación en distintos entornos y condiciones. Este modelo y la caracterización del desempeño computacional permite la comparación con otras soluciones ya existentes.
URI: http://bibdigital.epn.edu.ec/handle/15000/19608
Tipo: bachelorThesis
Aparece en las colecciones:Tesis Sistemas Informáticos y de Computación (ISIS)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD-9010.pdf879,96 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.