Modelo de detección de discurso de odio en Ecuador mediante clasificación supervisada de tweets y técnicas de NLP.

Suntaxi Recalde, José Gabriel

Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/23411

Título:	Modelo de detección de discurso de odio en Ecuador mediante clasificación supervisada de tweets y técnicas de NLP.
Autor:	Suntaxi Recalde, José Gabriel
Palabras clave:	APRENDIZAJE POR TRANSFERENCIA SISTEMAS DE INFORMACIÓN NEGOCIOS CLASIFICACIÓN SUPERVISADA APRENDIZAJE DE MÁQUINA MINERÍA DE TEXTO
Fecha de publicación:	oct-2022
Editorial:	Quito : EPN, 2022.
Citación:	Suntaxi Recalde, J.G.(2022). Modelo de detección de discurso de odio en Ecuador mediante clasificación supervisada de tweets y técnicas de NLP. 52 páginas. Quito : EPN.
Resumen:	Hate speech on social networks refers to the posting of offensive language, generally, directed at vulnerable groups in society. In this context, some governments have proposed legislative actions to require social media platforms to control content that may incite hatred and violence. In Ecuador, no governmental actions have been proposed to regulate content on social networks. On this basis, the present study develops a first approach to the development of a theoretical-practical framework to identify the hate speech of users of the Twitter platform in Ecuador. In addition, this research aims to generate empirical evidence for the debate and discussion of legal artifacts that would regulate the offensive content of posts generated in Ecuador. For this, three machine learning models based on NLP techniques are used. The results showed that the word embedding techniques are better adapted to the linguistic idiosyncrasy of Ecuador, and therefore, are more accurate in identifying Hate Speech with semantics typical of this geographical area. The transfer learning with the pretrained BERT (Bidirectional Encoder Representations from Transformers) model is better suited to identify Hate Speech in general linguistic contexts.
Descripción:	Hate Speech en redes sociales se refiere al posteo de lenguaje ofensivo generalmente dirigido a grupos vulnerables de la sociedad. Frente a este problema, algunos gobiernos han planteado acciones legislativas para exigir a las plataformas de redes sociales acciones de control de contenido que puedan incitar al odio y la violencia. En Ecuador, no se han planteado acciones gubernamentales de regulación de contenido en redes sociales. Sobre esta base, en el presente estudio se desarrolla una primera aproximación al desarrollo de un framework teórico-practico para identificar el discurso de odio de los usuarios de la plataforma Twitter en Ecuador. Además, esta investigación propone generar evidencia empírica para el debate y discusión de proyectos de Ley que regulen el contenido ofensivo de post generados en Ecuador. Para esto, se propone la especificación de tres modelos de aprendizaje automático basados en técnicas de NLP. Los resultados mostraron que las técnicas de word embeddings se adaptan de mejor manera a la idiosincrasia lingüística de Ecuador, y por lo tanto, son más precisas en identificar Hate Speech con semántica propia de esta zona geográfica, mientras que la técnica de aprendizaje por transferencia del modelo preentrenado BERT (Bidirectional Encoder Representations from Transformers) se adapta de mejor manera a identificar Hate Speech en contextos lingüísticos generales.
URI:	http://bibdigital.epn.edu.ec/handle/15000/23411
Tipo:	masterThesis
Aparece en las colecciones:	Tesis MAESTRÍA EN SISTEMAS DE INFORMACIÓN MENCIÓN INTELIGENCIA DE NEGOCIOS Y ANALÍTICA DE DATOS MASIVOS (FIS)

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
CD 12839.pdf		1,3 MB	Adobe PDF	Visualizar/Abrir

Muestra el registro Dublin Core completo del ítem

BIBDIGITAL