Please use this identifier to cite or link to this item: http://bibdigital.epn.edu.ec/handle/15000/24422
Title: Sistema de minería de datos del portal web setec para análisis de oferta y demanda al definir indicadores estáticos y dinámicos: sistema de minería de datos del portal web setec para análisis de la demanda al definir indicadores estáticos y dinámicos.
Authors: Jiménez Reino, Sergio Andrés
Keywords: ORDENADOR
SETEC
MINERÍA DE DATOS CRISP-DM
PRUEBAS DE USABILIDAD
RASPADO WEB
INTELIGENCIA DE NEGOCIOS
Issue Date: Apr-2023
Publisher: Quito : EPN, 2023.
Citation: Jiménez Reino, S.A. (2023). Sistema de minería de datos del portal web setec para análisis de oferta y demanda al definir indicadores estáticos y dinámicos: sistema de minería de datos del portal web setec para análisis de la demanda al definir indicadores estáticos y dinámicos. 62 páginas. Quito : EPN.
Abstract: The project consisted of developing a data mining system for the National Secretariat of Qualifications and Professional Training (SETEC) web portal to analyze the demand for courses and/or profiles of qualified professionals at a national level. The project was developed using CRISP-DM data mining methodology with the business understanding phase for the analysis of the SETEC web portal modules, understanding of data that make up each module of the web portal, data preparation, data extraction using web scraping techniques, data cleaning, transformation of variable types, and collection of these to create a data warehouse. Subsequently, the demand for these courses and profiles was analyzed based on the definition of static indicators based on real data and dynamic indicators developed through various machine learning models. The result of these phases was displayed in the Microsoft PowerBI tool through various graphics and visual components that show the indicators and their variation with different data dimensions. The usability of the visual application was evaluated based on the System Usability Scale (SUS) and Nielsen's 10 usability heuristics, where 40 people, including experts in data areas and those with moderate knowledge of data analysis and information technologies, scored the application. They concluded that it is an application with very few aesthetic problems and a good usability range.
Description: El proyecto consistió en el desarrollo de un sistema de minería de datos del portal web de la Secretaría Nacional de Cualificaciones y Capacitación Profesional (SETEC) para el análisis de la demanda de cursos y/o perfiles de profesionales cualificados a nivel nacional. El proyecto fue desarrollado usando metodología de minería de datos CRISP-DM con las fases de entendimiento del negocio para el análisis de los módulos del portal web SETEC, el entendimiento de datos que conforman cada módulo del portal web, preparación de datos, extracción datos usando técnicas de raspado web, limpieza de datos, transformación de tipo de variables y colección de estos para la creación de un Datawarehouse. Posteriormente se realizó el análisis de la demanda de estos cursos y perfiles en base a la definición de indicadores estáticos en base a datos reales e indicadores dinámicos desarrollados a través de distintos modelos de aprendizaje automático. El resultado de final estas fases desplegaron en la herramienta Microsoft PowerBI por medio de distintos gráficos y componentes visuales que muestran los indicadores además y su variación con las distintas dimensiones de datos. La usabilidad de aplicación visual fue evaluada en base a SUS (System Usability Scale) y las 10 heurísticas de Nielsen de usabilidad, donde 40 personas entre expertos en áreas de datos y conocimientos moderados en análisis de datos y tecnologías de la información puntuaron la aplicación concluyendo en que se trata de una aplicación con muy pocos problemas estéticos y un rango de usabilidad bueno.
URI: http://bibdigital.epn.edu.ec/handle/15000/24422
Type: bachelorThesis
Appears in Collections:TIC - Ingeniería en Ciencias de la Computación

Files in This Item:
File Description SizeFormat 
CD 13346.pdf5,88 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.