Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/22184
Título: Estudio comparativo de los algoritmos de clasificación supervisada empleando datos artificiales.
Autor: Llumiquinga Almeida, Eddy Patricio
Palabras clave: ALGORITMOS DE CLASIFICACIÓN
MULTILAYER PRECEPTRON
SUPPORT VECTOR MACHINE
Fecha de publicación: 18-feb-2022
Editorial: Quito, 2022
Citación: Llumiquinga Almeida, E. P. (2022). Estudio comparativo de los algoritmos de clasificación supervisada empleando datos artificiales. 190 hojas. Quito : EPN.
Resumen: This work reviews the theoretical part and performs its implementation in Matlab of some of the most used supervised classification algorithms: MLP (MultiLayer Perceptron), PNN (Probabilistic Neural Network), K-NN (K -Near Neighbor), NB (Naive Bayes), SVM (Support Vector Machines) and DT (Decision Tree). The main strategy introduced in this work is the use of artificial data, located in a two-dimensional space, which are classified under a nonlinear decision boundary also artificially generated. This allows to have under control the following parameters: the amount of training data assigned to the different classes, the amount of test data assigned to the different classes, the degree of asymmetry between these (there can be more training and/or test data for one of the classes) and their degree of remoteness to the decision boundary (it can be controlled whether the data are close, moderately remote, and far away). This point of view on the creation of artificial data is totally novel and constitutes a contribution to the state of the art that really allows comparing the different supervised classification methods so that firm conclusions can now be drawn regarding the accuracy obtained by them.
Descripción: En este trabajo se revisa la parte teórica y se realiza su implementación en Matlab de algunos de los algoritmos de clasificación supervisada más utilizados: MLP (Multilayer Perceptron o Perceptrón Multicapa), PNN (Probabilistic Neural Network o Red Neuronal Probabilística), K-NN (K -Near Neighbor o K vecinos más cercanos), NB (Naive Bayes), SVM (Support Vector Machines o Máquina de soporte vectorial) y DT (Decision Tree o Árboles de Decisión). La principal estrategia introducida en este trabajo es la utilización de datos artificiales, ubicados en un espacio bidimensional, que están clasificados bajo una frontera de decisión no lineal también generada artificialmente. Esto permite tener bajo control los siguientes parámetros: la cantidad de datos de entrenamiento asignadas a las distintas clases, la cantidad de datos de prueba asignadas a las distintas clases, el grado de asimetría entre y su grado de alejamiento a la frontera de decisión. Este punto de vista sobre la creación de datos artificiales es totalmente novedoso y se constituye en un aporte al estado del arte que permite realmente comparar los distintos métodos de clasificación supervisada de modo que ahora sí se pueden emitir conclusiones firmes respecto de la exactitud obtenida por ellos.
URI: http://bibdigital.epn.edu.ec/handle/15000/22184
Tipo: bachelorThesis
Aparece en las colecciones:Tesis Electrónica y Telecomunicaciones (IET)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD 11683.pdf11,23 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.