Please use this identifier to cite or link to this item: http://bibdigital.epn.edu.ec/handle/15000/20045
Title: Analítica de datos aplicada al enriquecimiento de rutas metabólicas a través de Target Fishing.
Authors: Cárdenas Ayala, Verónica Yakelin
Yánez Escarabay, Karla Victoria
Keywords: ANALÍTICA DE DATOS
BIOLOGÍA COMPUTACIONAL
Issue Date: 29-Jan-2019
Citation: Yánez Escarabay, K. V. /Cárdenas Ayala, V. Y.(2019). Analítica de datos aplicada al enriquecimiento de rutas metabólicas a través de Target Fishing. 68 hojas. Quito : EPN.
Abstract: This work proposes to implement Data Analytics to enrich the metabolic pathways of the KEGG Pathway database by applying the Target Fishing technique. Enrichment of the metabolic pathways consists of proposing alternatives of chemical compounds and targets through the treatment of information from four internal and external sources. In order to achieve this, the stages of the Life Cycle of Big Data Analytics methodology will be applied. The first phase covers the identification of sources and format of the information; the second phase comprises a joint treatment of the acquisition, filtering, extraction and cleaning of data. The third phase consists in the aggregation and representation of data, from which the subsets of chemical compounds and targets are obtained. In the fourth phase, the data analysis is performed using the Target Fishing technique. In addition, in the fifth phase, corresponding to the visualization of the data, a web interface is created. Finally, in the phase of using the results of the analysis, the hypergeometric distribution of probability is used to validate the enrichment of the information. When concluding with all the stages of the methodology it was possible to enrich the metabolic routes with alternatives of chemical compounds and therapeutic targets.
Description: El presente trabajo propone realizar Analítica de Datos para enriquecer las rutas metabólicas de la base de datos KEGG Pathway aplicando la técnica de Target Fishing. El enriquecimiento de las rutas metabólicas consiste en proponer alternativas de compuestos químicos y blancos mediante el tratamiento de la información proveniente de cuatro fuentes internas y externas. Para ello, se aplicarán las etapas del Ciclo de Vida de la Analítica de Big Data. La primera fase abarca la identificación de fuentes y formato de la información; la segunda fase comprende un tratamiento conjunto de la adquisición, filtrado, extracción y limpieza de datos. La tercera fase consiste en la agregación y representación de datos, la que obtiene los subconjuntos de compuestos químicos y blancos. En la cuarta fase se realiza el análisis de datos utilizando la técnica de Target Fishing. Además, en la quinta fase, correspondiente a la visualización de los datos, se crea una interfaz web. Y finalmente, en la fase de utilización de resultados del análisis, se usa la distribución hipergeométrica de probabilidad para validar el enriquecimiento de la información. Al concluir con todas las etapas de la metodología se logró enriquecer las rutas metabólicas con alternativas de compuestos químicos y blancos.
URI: http://bibdigital.epn.edu.ec/handle/15000/20045
Type: bachelorThesis
Appears in Collections:Tesis Sistemas Informáticos y de Computación (ISIS)

Files in This Item:
File Description SizeFormat 
CD 9474.pdf1,17 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.