16
Minería de Datos 1

Md session1

Embed Size (px)

Citation preview

Page 1: Md session1

Minería de Datos

1

Page 2: Md session1

Minería de Datos

2

Los datos que no vemos

Page 3: Md session1

El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases

de datos, de manera automática o semiautomática, con el objetivo de

3

semiautomática, con el objetivo de encontrar patrones repetitivos,

tendencias o reglas que expliquen el comportamiento de los datos en un

determinado contexto.

Page 4: Md session1

Por qué Minería de Datos?

Análisis de Riesgo Financiero y

crediticio

Análisis de Riesgo Financiero y

crediticio

Generación de Riqueza

Generación de Riqueza

Desde una perspectiva de gestión

4

Page 5: Md session1

Minería de Datos

Datos

5

Criterios

Interesantes

Patrones

Ocultos

Page 6: Md session1

Evolución de las Necesidades de Información

Evolución Preguntas de Negocios Tecnologías permitidas Características

Colección de datos

(Años 60)

Cuales fueron los ingresos

en los últimos 5 años?

Computadoras, cintas y

discos.

Liberación de datos

estáticos

retrospectiva.

Acceso a datos.

(Años 80)

Que rebajas se tuvieron en

Nueva Inglaterra en marzo?

Bases de datos

relacionales y lenguajes de

consulta estructurados

Nivel de registro en

liberación de datos(Años 80)consulta estructurados

(SQL)

liberación de datos

dinámicos

retrospectiva.

Data Warehouse y

soporte a la toma

de decisiones.

(Años 90)

Que rebajas se tuvieron en

Nueva Inglaterra en marzo?

Repetir para Boston.

(Procesamiento analítico

en línea, bases de datos

multidimensionales y

almacenes de datos.

Niveles múltiples en

liberación de datos

dinámicos

retrospectiva.

Data Mining (1995) Que es lo más probable que

pase con las rebajas en

Boston el próximo mes?

Algoritmos avanzados,

computadoras con

multiprocesador y bases

de datos masivas.

Liberación de

información

proactiva

prospectiva

Page 7: Md session1

Proceso de Minería de Datos

Mediante una técnica de

El modelo representa patrones de También pueden

técnica de Minería de Datos,

se obtiene un modelo de

conocimiento.

patrones de comportamiento observados en los

valores de las variables o

relaciones de asociación.

También pueden usarse técnicas

para generar distintos modelos.

Page 8: Md session1

Metas de la Minería de Datos

Procesar automáticamente grandescantidades de datos crudos.

Identificar los patrones más significativos yIdentificar los patrones más significativos yrelevantes.

Presentarlos como conocimiento apropiadopara satisfacer las metas del usuario.

Page 9: Md session1

Proceso de Minería de Datos

Page 10: Md session1

Metodología: CRISP-DM

Comprensión

del negocio

Entendimiento

de los datos

Preparación de Preparación de

los datos

Modelación

Evaluación

Despliegue de

resultados

DATOS

Page 11: Md session1

Metodología: CRISP-DM

CRoss-Industry Standard Process for Data Mining.

Metodología para el proceso de la MD.

Valida el proceso, dispone de modelos de referencia (plantillas), ayuda a planear y administrar proyectos.proyectos.

Sin propietario. Desarrollado por algunos líderes de la industria: IBM, SAS, SPSS/ISL, NCR, Daimler-Benz, OHRA

Alienta la inter-operatividad de herramientas.

Neutral para la Industria y para la herramienta

Enfocado al negocio y al análisis técnico

Page 12: Md session1

Metodología: SEMMA

Sample, Explore, Modify, Modify, Model, Assess

Page 13: Md session1

Metodología: SEMMA

Page 14: Md session1

Usos de las Metodologías

Page 15: Md session1

Comparación

SEMMA CRISP

Orientado al desarrollo

del proceso de MD

Orientado a los objetivos

empresariales

Se inicia analizando los Se inicia analizando losSe inicia analizando los

datos

Se inicia analizando los

objetivos del negocio

Ligada a productos SAS Metodología abierta y

gratuita

Orientado a una

metodología de gestión

de proyectos

Page 16: Md session1

Técnicas

Arboles de

Decisión

Agrupamiento

Decisión

Redes Neuronales

Algoritmos Genéticos