6

WekaAlgoritmos

Embed Size (px)

Citation preview

Page 1: WekaAlgoritmos

Universidad Nacional de Loja

Área de la Energía, las Industrias y losRecursos Naturales no Renovables

Inteligencia Arti�cial

MINERIA DE DATOS

Jhymer Martínez, Erika Masache

Ingeniería en Sistemas (10o Módulo)

Loja - 3 de julio de 2014

Page 2: WekaAlgoritmos

1. ALGORITMOS PARAMINERÍA DE DATOSUTILIZANDO WEKA

Existen algoritmos diseñados para realizar clasi�caciones en minería de da-tos, algunos de los cuales son OneR, ZeroR, J48, etc, de los cuales Se analizaránZeroR y Ridor aplicados en un ejemplo.

1.1. Algoritmo ZerorR

Este es uno de los más primitivos clasi�cadores, si las clases son categóricaspredice la predominante, o en caso de ser clases numéricas la promedia, segúnestudios de Witten y Frank (2000). Este es muy usado como punto de compa-ración para comprobar la efectividad de otros algoritmos.[2]

Características:

Cuando la clase es numérica se predice la media cuando la clase es nominalse predice la moda (el valor más frecuente.

sirve como base para comparar con otros método.

Si un método es peor que este, posiblemente haya sobreajuste.

1.2. Algoritmo Ridor

Ridor abrevia a RIpple-DOwn Rule. Este algoritmo genera una regla pordefecto que se ajuste a la mayoría de los ejemplos de entrenamiento y luegobusca excepciones con la menor tasa de error al clasi�car los propios ejemplosde entrenamiento. A continuación genera las excepciones a las excepciones conmenos error, de manera recursiva. Así, lleva a cabo una expansión de excepcio-nes en forma de árbol donde la raíz está formada por la regla por defecto.

Las excepciones son un conjunto de reglas que predicen las clases que no contem-pla la regla por defecto. IREP una implementación de Ridor y es el algoritmoempleado para encontrar excepciones. Éste construye las reglas añadiendo untérmino al antecedente en cada iteración de tal forma que el error se minimice.Los términos del antecedente son de la forma (atributo signo valor). [2]

1.3. Ejemplo

Para el siguiente ejemplo se han creado 2 archivos .ar� sobre las condicionesnecesarias para jugar un partido de tenis. La única diferencia entre los archivoses que uno de ellos se agrega el atributo de si jugar o no.Para descargar la librería de WEKA bamos a la siguiente dirección: http://www.cs.waikato.ac.nz/ml/weka/downloading.html. Como adicional se utili-zó el siguiente programa http://publicacioneshenry.wordpress.com/2011/05/11/weka-with-data-mining-done-in-java/ para realizar la lectura de losarchivos.

2

Page 3: WekaAlgoritmos

Archivo JugarTenis.ar�

@relation "Jugar Tenis"

@attribute vista {soleado , nublado , lluvioso}

@attribute temperature {Alta ,Media ,Baja}

@attribute humedad {Alta , Normal}

@attribute windy {TRUE , FALSE}

@data

soleado ,Alta ,Alta ,FALSE

soleado ,Alta ,Alta ,TRUE

nublado ,Alta ,Alta ,FALSE

lluvioso ,Media ,Alta ,FALSE

lluvioso ,Baja ,Normal ,FALSE

lluvioso ,Baja ,Normal ,TRUE

nublado ,Baja ,Normal ,TRUE

soleado ,Media ,Alta ,FALSE

soleado ,Baja ,Normal ,FALSE

lluvioso ,Media ,Normal ,TRUE

soleado ,Media ,Normal ,TRUE

nublado ,Baja ,Alta ,TRUE

nublado ,Alta ,Normal ,FALSE

lluvioso ,Media ,Alta ,TRUE

Utilizando el algoritmo ZeroR

Figura 1: Algoritmo ZeroR

3

Page 4: WekaAlgoritmos

Utilizando el algoritmo Ridor

Figura 2: Algoritmo Ridor

Ahora con el siguiente archivo:

Archivo JugarTenisCompleto.ar�

@relation "Jugar Tenis Completo"

@attribute vista {soleado , nublado , lluvioso}

@attribute temperature {Alta ,Media ,Baja}

@attribute humedad {Alta , Normal}

@attribute viento {TRUE , FALSE}

@attribute jugar {SI , NO}

@data

soleado ,Alta ,Alta ,FALSE ,NO

soleado ,Alta ,Alta ,TRUE ,NO

nublado ,Alta ,Alta ,FALSE ,SI

lluvioso ,Media ,Alta ,FALSE ,SI

lluvioso ,Baja ,Normal ,FALSE ,SI

lluvioso ,Baja ,Normal ,TRUE ,NO

nublado ,Baja ,Normal ,TRUE ,SI

soleado ,Media ,Alta ,FALSE ,NO

soleado ,Baja ,Normal ,FALSE ,SI

lluvioso ,Media ,Normal ,TRUE ,SI

soleado ,Media ,Normal ,TRUE ,SI

nublado ,Baja ,Alta ,TRUE ,SI

nublado ,Alta ,Normal ,FALSE ,SI

lluvioso ,Media ,Alta ,TRUE ,NO

4

Page 5: WekaAlgoritmos

Utilizando el algoritmo ZeroR

Figura 3: Algoritmo ZeroR Completo

Utilizando el algoritmo Ridor

Figura 4: Algoritmo Ridor Completo

5

Page 6: WekaAlgoritmos

2. Bibliografía

Referencias

[1] J. Serrano. Métodos de Aprendizaje Automático para el Des-cubrimiento de Conocimiento en Datos Médicos sobre Arteros-clerosis. Disponible en: http://www.ejbi.org/en/ejbi/article/41-es-metodos-de-aprendizaje-automatico-para-el-descubrimiento-de-conocimiento-en-datos-medicos-sobre-arterosclerosis.html Fecha de consulta: 03-07-2014.

[2] M. Rigoberto. Aplicación de técnicas de minería de datos con We-ka Acknowledge Explorer. Disponible en: http://innovaciontec.idict.cu/innovacion/article/viewFile/244/245â�� Fecha de consulta: 03-07-2014.

[3] H. Angelica. Minería de datos: competencias básicas. Disponible en:http://inteligenciartificialudec.wikispaces.com/file/view/TRABAJO+DE+INT+ARTFICIAL+WEKA.pdf Fecha de consulta: 03-07-2014.

6