Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/22299
Título: Desarrollo de un sistema de detección de necesidades de atención municipal en base al análisis de tweets.
Autor: Sanango Simbaña, Edison Ubaldo
Palabras clave: INTELIGENCIA DE NEGOCIOS
EXTRACCIÓN DE TÓPICOS
Fecha de publicación: 30-mar-2022
Editorial: Quito, 2022
Citación: Sanango Simbaña, E. U. (2022). Desarrollo de un sistema de detección de necesidades de atención municipal en base al análisis de tweets. 65 hojas. Quito : EPN.
Resumen: Tweets gained fame in recent years due to the use of social networks, they allow analyze different aspects such as feelings and extract topics from them. This project details the development of a needs detection system regarding the Municipality of Quito based on the analysis of tweets. The topics that are involved in this project are the extraction of topics to discover the most important aspects which are spoken in Quito and according to their sentimental polarity classify them as needs and the analysis of feelings to classify the polarity (positive, negative or neutral) of citizenship attitude in each topic found along with the location of important and most mentioned places by citizens. In the extraction of topics, cleaning and data processing techniques were considered, such as eliminating punctuation marks, converting to lowercase, removing stopwords from the Spanish language, among others. Likewise, the algorithm used was Gibs Sampling algorithm for the Dirichlet Multinomial Mixture model (GSDMM), which performed better than the Latent Dirichlet Allocation (LDA) algorithm. After applying GSDMM, seven topics were obtained, of which the sentimental polarity was analyzed. In the sentiment analysis section, a Logistic Regression model was trained to obtain the polarity (positive, negative and neutral) of each topic. In addition, subtopics of some topics were generated due to their low granularity of detail.
Descripción: Los tweets ganaron espacio los últimos años debido al uso de las redes sociales, en ellos se puede analizar diferentes aspectos como sentimientos y extraer tópicos de ellos. En este proyecto se detalla la construcción de un sistema de detección de necesidades concernientes al Municipio de Quito en base al análisis de tweets. Los temas que aborda este proyecto son la extracción de tópicos para descubrir los temas más importantes que se hablan en Quito y según su polaridad sentimental clasificarlos como necesidades, y el análisis de sentimientos para orientar la polaridad (positiva, negativa o neutral) de la ciudadanía en cada tópico encontrado junto con la ubicación de sectores relevantes y más mencionados por la ciudadanía. En la extracción de tópicos se consideraron técnicas de limpieza y procesamiento de datos como eliminar signos de puntuación, convertir a minúsculas, eliminar las palabras no útiles (stopwords) del idioma español, entre otras. Asimismo, el algoritmo utilizado fue Algoritmo de muestreo de Gibbs para el modelo de mezcla multinomial de Dirichlet GSDMM (Gibbs Sampling algorithm for the Dirichlet Multinomial Mixture model) que tuvo un mejor desempeño que el algoritmo Asignación latente de Dirichlet LDA (Latent Dirichlet Allocation). Después de aplicar GSDMM se generaron siete tópicos de los cuales se analizó la polaridad sentimental. En la parte del análisis de sentimientos se entrenó un modelo de Regresión Logística para obtener la polaridad (positivo, negativo y neutro) de cada tópico. Además, se generaron subtópicos de algunos tópicos debido a su poca granularidad de detalle.
URI: http://bibdigital.epn.edu.ec/handle/15000/22299
Tipo: bachelorThesis
Aparece en las colecciones:Tesis Sistemas Informáticos y de Computación (ISIS)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD 11800.pdf1,69 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.