Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/24506
Título: Desarrollo de un prototipo de sistema para el análisis de opiniones basado en tweets. Caso de estudio: metro de Quito.
Autor: Quilumba Toaquiza, Jorge Luis
Villacis Navarrete, Kevin Joel
Palabras clave: SISTEMA DE INFORMACIÓN
DATA MINING
PREPROCESAMIENTO DE DATOS
ALGORITMO GSDMM
APRENDIZAJE SUPERVISADO SVM
VISUAL STORYTELLING
FLASK
PLOTLY
DASH
PANDA
Fecha de publicación: jun-2023
Editorial: Quito : EPN, 2023.
Citación: Quilumba Toaquiza, J.L. ; Villacis Navarrete, K.J. (2023). Desarrollo de un prototipo de sistema para el análisis de opiniones basado en tweets. Caso de estudio: metro de Quito. 66 páginas. Quito : EPN.
Resumen: Twitter is a social media platform designed to share immediate information about various topics, including political, social, and national issues. This project aimed to analyze opinions on Quito's subway through the CRISP-DM methodology, which involved collecting tweets and processing the data to ensure information quality. The GSDMM model was then used for topic generation and identification of dominant topics, and a supervised learning model, SVM, was trained with Spanish data for sentiment analysis to determine tweet polarity. A dashboard was developed as a prototype for web development using Flask, Dash, and Python as the programming language. Pandas was used to structure the data, and Plotly was used to create graphics to be displayed on the dashboard. The analysis uses visual storytelling to easily display the most relevant topics, such as progress, budget, subway administration, and construction issues, to identify user viewpoints and polarity of feelings (positive and negative). The dashboard is divided according to the different periods of Quito's mayoralties between 2015 and 2023.
Descripción: Twitter es una red social cuyo enfoque es compartir información inmediata de distintos temas y posturas sobre asuntos políticos, sociales, problemáticas nacionales, entre otros. En ese sentido, el presente proyecto estuvo enfocado en realizar un análisis de opiniones sobre tweets relacionados al metro de Quito con base en la metodología CRISP-DM, que consistió en recopilar varios tweets y procesar los datos para garantizar la calidad de la información. Posteriormente, fue aplicado el modelo GSDMM para la generación de tópicos e identificación de los temas dominantes; esta fase implicó un previo análisis entre el GSDMM y el LDA, lo que permitió determinar que el primero genera mejores resultados en cuanto al manejo de texto no estructurado. Finalmente, se entrenó un modelo de aprendizaje supervisado, SVM, con datos en español, debido a que tuvo mejor score frente algoritmos como decision tree, naive bajes y logistic regression; de este modo, fue posible efectuar el análisis de sentimientos y determinar así la polaridad de los tweets. Para presentar los resultados de manera visual, se elaboró un dashboard como prototipo de desarrollo web mediante un framework, como Flask y Dash, y con Python como lenguaje de programación. Así mismo, el análisis tiene fundamentos de visual storytelling que permite mostrar fácilmente los temas más relevantes sobre el avance de la obra, presupuesto, administración del metro, algunos inconvenientes en la construcción, entre otros, lo que da paso a identificar el punto de vista de los usuarios y la polaridad de sentimientos: positivo y negativo.
URI: http://bibdigital.epn.edu.ec/handle/15000/24506
Tipo: bachelorThesis
Aparece en las colecciones:Tesis Sistemas Informáticos y de Computación (ISIS)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD 13442.pdf2,63 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.