Tutorial Rapidminer
Transcript of Tutorial Rapidminer
-
7/26/2019 Tutorial Rapidminer
1/24
RAPIDMINER 5.0Ricardo Aler Mur
-
7/26/2019 Tutorial Rapidminer
2/24
NDICE
1. rbol de decisin
2. Reglas
3. rbol de decisin con validacin cruzada
4. rbol de decisin vs. knn con validacin cruzada5. rbol decisin vs. knn con validacin cruzada
evaluando el coste (con matriz de costes)
6. rbol de decisin vs. Metacost con rboles de
decisin y matriz de costes7. Comparacin de curvas ROC
-
7/26/2019 Tutorial Rapidminer
3/24
1. RBOL DE DECISIN
Ejemplo 1 del tutorial:
http://www.dataprix.com/files/RapidMiner_Tutorial_online_Operadores.pdf
http://www.dataprix.com/files/RapidMiner_Tutorial_online_Operadores.pdfhttp://www.dataprix.com/files/RapidMiner_Tutorial_online_Operadores.pdfhttp://www.dataprix.com/files/RapidMiner_Tutorial_online_Operadores.pdfhttp://www.dataprix.com/files/RapidMiner_Tutorial_online_Operadores.pdfhttp://www.dataprix.com/files/RapidMiner_Tutorial_online_Operadores.pdfhttp://www.dataprix.com/files/RapidMiner_Tutorial_online_Operadores.pdfhttp://www.dataprix.com/files/RapidMiner_Tutorial_online_Operadores.pdfhttp://www.dataprix.com/files/RapidMiner_Tutorial_online_Operadores.pdfhttp://www.dataprix.com/files/RapidMiner_Tutorial_online_Operadores.pdf -
7/26/2019 Tutorial Rapidminer
4/24
-
7/26/2019 Tutorial Rapidminer
5/24
RBOL DE DECISIN
-
7/26/2019 Tutorial Rapidminer
6/24
TECLAS IMPORTANTES
F8 o View -> Perspectives -> Design Vista de procesos
F9 o View -> Perspectives -> Results
Vista de resultados
-
7/26/2019 Tutorial Rapidminer
7/24
2. REGLA DE DECISIN
Pinchar con el botn derecho del ratn sobre lacaja del rbol de decisin y reemplazar el modelopara usar reglas (Rule induction)
-
7/26/2019 Tutorial Rapidminer
8/24
3. CLASIFICACIN CON VALIDACINCRUZADA
Ejemplo 9 del tutorial, pero para clasificacin
-
7/26/2019 Tutorial Rapidminer
9/24
-
7/26/2019 Tutorial Rapidminer
10/24
-
7/26/2019 Tutorial Rapidminer
11/24
4. RBOL DE DECISIN Y KNN CONVALIDACIN CRUZADA
Usar File -> Open Template-> Compare LearningAlgorithms by Significance Test
Reemplazar el primer clasificador por un rbol de
decisin Reemplazar el segundo clasificador por KNN
Reemplazar ambos regression performancemeasurement por binomial performance
measurement. Hacer que se impriman, aparte deaccuracy, tambin AUC
-
7/26/2019 Tutorial Rapidminer
12/24
-
7/26/2019 Tutorial Rapidminer
13/24
-
7/26/2019 Tutorial Rapidminer
14/24
-
7/26/2019 Tutorial Rapidminer
15/24
-
7/26/2019 Tutorial Rapidminer
16/24
-
7/26/2019 Tutorial Rapidminer
17/24
5. RBOL DECISIN + CON MATRIZ DECOSTES)
Reemplazar ambos binomial performancemeasurement por performance costs.
Introducir en ambos una matriz de costes, de tal
manera que el coste de confundir la clase 1 por lados sea de
-
7/26/2019 Tutorial Rapidminer
18/24
-
7/26/2019 Tutorial Rapidminer
19/24
6. RBOL DE DECISIN VS. METACOST CONRBOLES DE DECISIN Y MATRIZ DE COSTES
Vamos a sustituir knn por metacost, querecordemos era capaz de estimar probabilidades ydada una matriz de costes, era capaz de devolver
un clasificador ptimo para ella Metacost es un clasificador meta y trabaja con
cualquier clasificador. En este caso utilizaremoscomo clasificador para metacost a los rboles dedecisin
-
7/26/2019 Tutorial Rapidminer
20/24
-
7/26/2019 Tutorial Rapidminer
21/24
-
7/26/2019 Tutorial Rapidminer
22/24
7. COMPARACIN DE CURVAS ROC
Usaremos la File -> Template compare ROCs
Incluiremos decision tree y bagging con decisiontrees
-
7/26/2019 Tutorial Rapidminer
23/24
-
7/26/2019 Tutorial Rapidminer
24/24