Please use this identifier to cite or link to this item: http://bibdigital.epn.edu.ec/handle/15000/22623
Title: Métodos y procesos sofisticados de reducción de dimensión y selección de variables para un modelo de respuesta binaria.
Authors: Moreno Manobanda, Josselyn Lizeth
Keywords: APRENDIZAJE
ESTADÍSTICA
MINERÍA DE DATOS
MODELO DE RIESGOS
BIG DATA
Issue Date: Apr-2022
Publisher: Quito : EPN, 2022
Citation: Moreno Manobanda, J. L. (2022). Métodos y procesos sofisticados de reducción de dimensión y selección de variables para un modelo de respuesta binaria. 101 páginas. Quito : EPN.
Abstract: The current challenge for researchers and professionals is the rate of development regarding data collected. The manipulation of this large amount of data is currently considered an open and booming topic. Part of the information that is collected is usually irrelevant and unnecessary, which motivates data analysts to use technological resources that exclude this information, achieving results referring to some phenomenon. In this paper, methods and techniques for variable selection and dimension reduction are proposed to overcome the problem of handling large amounts of data. On the one hand, it goes deeper into machine learning algorithms and then into unusual selection techniques. These methods are applied and finally a validation of the results is carried out, concluding an adequate proposed model. The database used in this project comes from a private consultancy.
Description: El desafío actual para investigadores y profesionales es la tasa de desarrollo respecto a datos recopilados. La manipulación de esta gran cantidad de datos es considerado actualmente un tema abierto y de gran auge. Parte de la información que se recolecta usualmente es irrelevante e innecesaria, lo que motiva a los analistas de datos a utilizar recursos tecnológicos que excluyan esta información, alcanzado resultados interpretables referentes algún fenómeno. En el presente trabajo, se plantean métodos y técnicas de selección de variables y reducción de dimensiones para sobrellevar el problema del manejo de grandes cantidades de datos. Por un lado, se profundiza en algoritmos de aprendizaje automático y luego, en técnicas de selección poco comunes. Se aplican estos métodos y finalmente se realiza una validación de los resultados concluyendo un modelo propuesto adecuado. La base de datos con la que se trabaja en este proyecto proviene de una consultoría privada.
URI: http://bibdigital.epn.edu.ec/handle/15000/22623
Type: bachelorThesis
Appears in Collections:Tesis Matemáticas (MAT)

Files in This Item:
File Description SizeFormat 
CD 12269.pdf1,09 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.