Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/17913
Título: Implementación de un sistema para el análisis de sentimientos en un conjunto de datos
Autor: Vinlasaca Viera, Jorge Gustavo
Palabras clave: BASES DE DATOS
SISTEMAS DISTRIBUIDOS
MINERIA DE OPINION
ALGORITMOS DE CLASIFICACION
ANALISIS DE SENTIMIENTOS
Fecha de publicación: 16-ago-2017
Editorial: Quito, 2017.
Citación: Vinlasaca Viera, J. G. (2017). Implementación de un sistema para el análisis de sentimientos en un conjunto de datos. 120 hojas. Quito : EPN.
Resumen: In this work is presented the design and implementation of a system to perform sentiment analysis over a dada set. In chapter one, the theoretical framework is established, for which a brief summary of Twitter, the fundamental concepts of sentiment analysis, Hadoop and its components, the Mahout library, and Complement Naïve Bayes Classifier Algorithm, are made. In chapter two, a summary of the design and implementation of the four main components of the system: data collector, data preprocessor, cluster to run Hadoop and analyze data, and results collector is presented. In chapter three, the test of the system are presented, for which five classification models were trained and the one with the best performance was evaluated using additional data; later an analysis of the evaluations’ results was carried out. Finally, in chapter four, the conclusions obtained and the recommendations that could contribute to future works are presented.
Descripción: El presente trabajo presenta el diseño e implementación de un sistema para el análisis de sentimientos en un conjunto de datos. En el capítulo uno se establecen los fundamentos teóricos, para lo cual se realiza una breve resumen de Twitter, los conceptos fundamentales del análisis de sentimientos, Hadoop y sus componentes, la biblioteca Mahout, y el algoritmo de clasificación Naïve Bayes Complementario. En el capítulo dos se presenta un resumen del diseño e implementación de los cuatro componentes principales del sistema: recolector de datos, preprocesador de datos, clúster para ejecutar Hadoop y analizar datos, y recolector de resultados. En el capítulo tres se presentan las pruebas de funcionamiento para lo cual se entrenaron cinco modelos de clasificación y se evaluó el comportamiento de aquel que presentó una mayor eficiencia utilizando datos adicionales; posteriormente se realizó un análisis de los resultados obtenidos. Finalmente, en el capítulo cuatro se presentan las conclusiones obtenidas y se presentan recomendaciones que podrían aportar para la realización de futuros trabajos.
URI: http://bibdigital.epn.edu.ec/handle/15000/17913
Tipo: bachelorThesis
Aparece en las colecciones:Tesis Electrónica y Redes de Información (IER)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD-8106.pdf6,11 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.