Upload
jhymermartinez
View
28
Download
2
Embed Size (px)
Citation preview
Universidad Nacional de Loja
Área de la Energía, las Industrias y losRecursos Naturales no Renovables
Inteligencia Arti�cial
MINERIA DE DATOS
Jhymer Martínez, Erika Masache
Ingeniería en Sistemas (10o Módulo)
Loja - 3 de julio de 2014
1. ALGORITMOS PARAMINERÍA DE DATOSUTILIZANDO WEKA
Existen algoritmos diseñados para realizar clasi�caciones en minería de da-tos, algunos de los cuales son OneR, ZeroR, J48, etc, de los cuales Se analizaránZeroR y Ridor aplicados en un ejemplo.
1.1. Algoritmo ZerorR
Este es uno de los más primitivos clasi�cadores, si las clases son categóricaspredice la predominante, o en caso de ser clases numéricas la promedia, segúnestudios de Witten y Frank (2000). Este es muy usado como punto de compa-ración para comprobar la efectividad de otros algoritmos.[2]
Características:
Cuando la clase es numérica se predice la media cuando la clase es nominalse predice la moda (el valor más frecuente.
sirve como base para comparar con otros método.
Si un método es peor que este, posiblemente haya sobreajuste.
1.2. Algoritmo Ridor
Ridor abrevia a RIpple-DOwn Rule. Este algoritmo genera una regla pordefecto que se ajuste a la mayoría de los ejemplos de entrenamiento y luegobusca excepciones con la menor tasa de error al clasi�car los propios ejemplosde entrenamiento. A continuación genera las excepciones a las excepciones conmenos error, de manera recursiva. Así, lleva a cabo una expansión de excepcio-nes en forma de árbol donde la raíz está formada por la regla por defecto.
Las excepciones son un conjunto de reglas que predicen las clases que no contem-pla la regla por defecto. IREP una implementación de Ridor y es el algoritmoempleado para encontrar excepciones. Éste construye las reglas añadiendo untérmino al antecedente en cada iteración de tal forma que el error se minimice.Los términos del antecedente son de la forma (atributo signo valor). [2]
1.3. Ejemplo
Para el siguiente ejemplo se han creado 2 archivos .ar� sobre las condicionesnecesarias para jugar un partido de tenis. La única diferencia entre los archivoses que uno de ellos se agrega el atributo de si jugar o no.Para descargar la librería de WEKA bamos a la siguiente dirección: http://www.cs.waikato.ac.nz/ml/weka/downloading.html. Como adicional se utili-zó el siguiente programa http://publicacioneshenry.wordpress.com/2011/05/11/weka-with-data-mining-done-in-java/ para realizar la lectura de losarchivos.
2
Archivo JugarTenis.ar�
@relation "Jugar Tenis"
@attribute vista {soleado , nublado , lluvioso}
@attribute temperature {Alta ,Media ,Baja}
@attribute humedad {Alta , Normal}
@attribute windy {TRUE , FALSE}
@data
soleado ,Alta ,Alta ,FALSE
soleado ,Alta ,Alta ,TRUE
nublado ,Alta ,Alta ,FALSE
lluvioso ,Media ,Alta ,FALSE
lluvioso ,Baja ,Normal ,FALSE
lluvioso ,Baja ,Normal ,TRUE
nublado ,Baja ,Normal ,TRUE
soleado ,Media ,Alta ,FALSE
soleado ,Baja ,Normal ,FALSE
lluvioso ,Media ,Normal ,TRUE
soleado ,Media ,Normal ,TRUE
nublado ,Baja ,Alta ,TRUE
nublado ,Alta ,Normal ,FALSE
lluvioso ,Media ,Alta ,TRUE
Utilizando el algoritmo ZeroR
Figura 1: Algoritmo ZeroR
3
Utilizando el algoritmo Ridor
Figura 2: Algoritmo Ridor
Ahora con el siguiente archivo:
Archivo JugarTenisCompleto.ar�
@relation "Jugar Tenis Completo"
@attribute vista {soleado , nublado , lluvioso}
@attribute temperature {Alta ,Media ,Baja}
@attribute humedad {Alta , Normal}
@attribute viento {TRUE , FALSE}
@attribute jugar {SI , NO}
@data
soleado ,Alta ,Alta ,FALSE ,NO
soleado ,Alta ,Alta ,TRUE ,NO
nublado ,Alta ,Alta ,FALSE ,SI
lluvioso ,Media ,Alta ,FALSE ,SI
lluvioso ,Baja ,Normal ,FALSE ,SI
lluvioso ,Baja ,Normal ,TRUE ,NO
nublado ,Baja ,Normal ,TRUE ,SI
soleado ,Media ,Alta ,FALSE ,NO
soleado ,Baja ,Normal ,FALSE ,SI
lluvioso ,Media ,Normal ,TRUE ,SI
soleado ,Media ,Normal ,TRUE ,SI
nublado ,Baja ,Alta ,TRUE ,SI
nublado ,Alta ,Normal ,FALSE ,SI
lluvioso ,Media ,Alta ,TRUE ,NO
4
Utilizando el algoritmo ZeroR
Figura 3: Algoritmo ZeroR Completo
Utilizando el algoritmo Ridor
Figura 4: Algoritmo Ridor Completo
5
2. Bibliografía
Referencias
[1] J. Serrano. Métodos de Aprendizaje Automático para el Des-cubrimiento de Conocimiento en Datos Médicos sobre Arteros-clerosis. Disponible en: http://www.ejbi.org/en/ejbi/article/41-es-metodos-de-aprendizaje-automatico-para-el-descubrimiento-de-conocimiento-en-datos-medicos-sobre-arterosclerosis.html Fecha de consulta: 03-07-2014.
[2] M. Rigoberto. Aplicación de técnicas de minería de datos con We-ka Acknowledge Explorer. Disponible en: http://innovaciontec.idict.cu/innovacion/article/viewFile/244/245â�� Fecha de consulta: 03-07-2014.
[3] H. Angelica. Minería de datos: competencias básicas. Disponible en:http://inteligenciartificialudec.wikispaces.com/file/view/TRABAJO+DE+INT+ARTFICIAL+WEKA.pdf Fecha de consulta: 03-07-2014.
6