Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://bibdigital.epn.edu.ec/handle/15000/24506
Langanzeige der Metadaten
DC ElementWertSprache
dc.contributor.authorQuilumba Toaquiza, Jorge Luis-
dc.contributor.authorVillacis Navarrete, Kevin Joel-
dc.date.accessioned2023-08-08T15:04:42Z-
dc.date.available2023-08-08T15:04:42Z-
dc.date.issued2023-06-
dc.identifier.citationQuilumba Toaquiza, J.L. ; Villacis Navarrete, K.J. (2023). Desarrollo de un prototipo de sistema para el análisis de opiniones basado en tweets. Caso de estudio: metro de Quito. 66 páginas. Quito : EPN.es_ES
dc.identifier.otherT-IS 1772 / CD 13442-
dc.identifier.urihttp://bibdigital.epn.edu.ec/handle/15000/24506-
dc.descriptionTwitter es una red social cuyo enfoque es compartir información inmediata de distintos temas y posturas sobre asuntos políticos, sociales, problemáticas nacionales, entre otros. En ese sentido, el presente proyecto estuvo enfocado en realizar un análisis de opiniones sobre tweets relacionados al metro de Quito con base en la metodología CRISP-DM, que consistió en recopilar varios tweets y procesar los datos para garantizar la calidad de la información. Posteriormente, fue aplicado el modelo GSDMM para la generación de tópicos e identificación de los temas dominantes; esta fase implicó un previo análisis entre el GSDMM y el LDA, lo que permitió determinar que el primero genera mejores resultados en cuanto al manejo de texto no estructurado. Finalmente, se entrenó un modelo de aprendizaje supervisado, SVM, con datos en español, debido a que tuvo mejor score frente algoritmos como decision tree, naive bajes y logistic regression; de este modo, fue posible efectuar el análisis de sentimientos y determinar así la polaridad de los tweets. Para presentar los resultados de manera visual, se elaboró un dashboard como prototipo de desarrollo web mediante un framework, como Flask y Dash, y con Python como lenguaje de programación. Así mismo, el análisis tiene fundamentos de visual storytelling que permite mostrar fácilmente los temas más relevantes sobre el avance de la obra, presupuesto, administración del metro, algunos inconvenientes en la construcción, entre otros, lo que da paso a identificar el punto de vista de los usuarios y la polaridad de sentimientos: positivo y negativo.es_ES
dc.description.abstractTwitter is a social media platform designed to share immediate information about various topics, including political, social, and national issues. This project aimed to analyze opinions on Quito's subway through the CRISP-DM methodology, which involved collecting tweets and processing the data to ensure information quality. The GSDMM model was then used for topic generation and identification of dominant topics, and a supervised learning model, SVM, was trained with Spanish data for sentiment analysis to determine tweet polarity. A dashboard was developed as a prototype for web development using Flask, Dash, and Python as the programming language. Pandas was used to structure the data, and Plotly was used to create graphics to be displayed on the dashboard. The analysis uses visual storytelling to easily display the most relevant topics, such as progress, budget, subway administration, and construction issues, to identify user viewpoints and polarity of feelings (positive and negative). The dashboard is divided according to the different periods of Quito's mayoralties between 2015 and 2023.es_ES
dc.language.isospaes_ES
dc.publisherQuito : EPN, 2023.es_ES
dc.rightsopenAccesses_ES
dc.subjectSISTEMA DE INFORMACIÓNes_ES
dc.subjectDATA MININGes_ES
dc.subjectPREPROCESAMIENTO DE DATOSes_ES
dc.subjectALGORITMO GSDMMes_ES
dc.subjectAPRENDIZAJE SUPERVISADO SVMes_ES
dc.subjectVISUAL STORYTELLINGes_ES
dc.subjectFLASKes_ES
dc.subjectPLOTLYes_ES
dc.subjectDASHes_ES
dc.subjectPANDAes_ES
dc.titleDesarrollo de un prototipo de sistema para el análisis de opiniones basado en tweets. Caso de estudio: metro de Quito.es_ES
dc.typebachelorThesises_ES
Enthalten in den Sammlungen:Tesis Sistemas Informáticos y de Computación (ISIS)

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
CD 13442.pdf2,63 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.