Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://bibdigital.epn.edu.ec/handle/15000/22299
Titel: Desarrollo de un sistema de detección de necesidades de atención municipal en base al análisis de tweets.
Autor(en): Sanango Simbaña, Edison Ubaldo
Stichwörter: INTELIGENCIA DE NEGOCIOS
EXTRACCIÓN DE TÓPICOS
Erscheinungsdatum: 30-Mär-2022
Herausgeber: Quito, 2022
Zitierform: Sanango Simbaña, E. U. (2022). Desarrollo de un sistema de detección de necesidades de atención municipal en base al análisis de tweets. 65 hojas. Quito : EPN.
Zusammenfassung: Tweets gained fame in recent years due to the use of social networks, they allow analyze different aspects such as feelings and extract topics from them. This project details the development of a needs detection system regarding the Municipality of Quito based on the analysis of tweets. The topics that are involved in this project are the extraction of topics to discover the most important aspects which are spoken in Quito and according to their sentimental polarity classify them as needs and the analysis of feelings to classify the polarity (positive, negative or neutral) of citizenship attitude in each topic found along with the location of important and most mentioned places by citizens. In the extraction of topics, cleaning and data processing techniques were considered, such as eliminating punctuation marks, converting to lowercase, removing stopwords from the Spanish language, among others. Likewise, the algorithm used was Gibs Sampling algorithm for the Dirichlet Multinomial Mixture model (GSDMM), which performed better than the Latent Dirichlet Allocation (LDA) algorithm. After applying GSDMM, seven topics were obtained, of which the sentimental polarity was analyzed. In the sentiment analysis section, a Logistic Regression model was trained to obtain the polarity (positive, negative and neutral) of each topic. In addition, subtopics of some topics were generated due to their low granularity of detail.
Beschreibung: Los tweets ganaron espacio los últimos años debido al uso de las redes sociales, en ellos se puede analizar diferentes aspectos como sentimientos y extraer tópicos de ellos. En este proyecto se detalla la construcción de un sistema de detección de necesidades concernientes al Municipio de Quito en base al análisis de tweets. Los temas que aborda este proyecto son la extracción de tópicos para descubrir los temas más importantes que se hablan en Quito y según su polaridad sentimental clasificarlos como necesidades, y el análisis de sentimientos para orientar la polaridad (positiva, negativa o neutral) de la ciudadanía en cada tópico encontrado junto con la ubicación de sectores relevantes y más mencionados por la ciudadanía. En la extracción de tópicos se consideraron técnicas de limpieza y procesamiento de datos como eliminar signos de puntuación, convertir a minúsculas, eliminar las palabras no útiles (stopwords) del idioma español, entre otras. Asimismo, el algoritmo utilizado fue Algoritmo de muestreo de Gibbs para el modelo de mezcla multinomial de Dirichlet GSDMM (Gibbs Sampling algorithm for the Dirichlet Multinomial Mixture model) que tuvo un mejor desempeño que el algoritmo Asignación latente de Dirichlet LDA (Latent Dirichlet Allocation). Después de aplicar GSDMM se generaron siete tópicos de los cuales se analizó la polaridad sentimental. En la parte del análisis de sentimientos se entrenó un modelo de Regresión Logística para obtener la polaridad (positivo, negativo y neutro) de cada tópico. Además, se generaron subtópicos de algunos tópicos debido a su poca granularidad de detalle.
URI: http://bibdigital.epn.edu.ec/handle/15000/22299
Art: bachelorThesis
Enthalten in den Sammlungen:Tesis Sistemas Informáticos y de Computación (ISIS)

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
CD 11800.pdf1,69 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.