25

Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

Embed Size (px)

Citation preview

Page 1: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist
Page 2: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

Minería de Datos. Algo más que el ejemplo del Tenis.

Sergio Carrillo VilaData Platform Engineer – Business IntelligenceMicrosoft Business Management Specialist

Click here to add your MVP logo or MS Cert Logo

[email protected]

Page 3: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α ¿Qué es la minería de datos?β Usos de la minería de datos

α El ciclo de vida de un proyecto de Minería de Datosα Los datos para Minería de datos. Demoα Algoritmos

β Naive-Bayes. Demoβ Arboles de decisión. Demoβ Reglas de asociación. Demo

α Excel como herramienta de Minería de Datos. Demo

α Preguntas

Agenda

Page 4: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Proceso de analizar los datos para encontrar patrones ocultos mediante el uso de metodologías automáticas

α Análisis Predictivo

α Aumentar el valor de nuestros datos

¿Qué es la minería de datos?

Page 5: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Generación de Recomendacionesα Detección de Anomalíasα Administración de Riegosα Segmentación de Clientesα Previsionesα Anuncios personalizadosα …

¿Qué es la minería de datos?Usos de la minería de datos

Page 6: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

Ciclo de VidaDe un proyecto de Minería de Datos

Transformación

Actuación

Medición

Identificación

Page 7: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Interpretación de los datosα Vista sobre los datos

β Estadisticasβ Frecuencias

α Casosα Atributos

β Categóricos o nominalesβ Rankingsβ Intervalosβ Variables numéricas

α Estados

Los datos para la Minería

Page 8: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

DEMODatos para la minería

Page 9: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Es importante conocer nuestro datoβ No nos vamos a embarcar en un proyecto de mineria sin

hacerlo

α Es importante interpretar estos datosβ No juntemos peras con manzanas

α La exploración de los datos…β Puede mostrarnos anomalías en nuestro negocioβ Puede plantearnos nuevos problemas

Resumiendo

Page 10: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Ofrece un método sistemático para aprender basado en los datos.

α Cuenta las correlaciones que hay entre la variable que queremos predecir y el resto de variables

α Una vez que tiene calculada las correlaciones, aplica las probabilidades.

α No puede utilizar atributos continuos para predecir, en el caso de tenerlos, utilizar rangos.

α Parámetrosβ MAXIMUN_INPUT_ATTRIBUTESβ MAXIMUN_OUTPUT_ATTRIBUTESβ MAXIMUN_STATESβ MINIMUM_DEPENDENCY_PROBABILITY

AlgoritmosNaive-Bayes

Page 11: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

DEMONaive-Bayes

Page 12: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Naive-Bayes es un algoritmo rápidoα Solo para atributos discretosα Visualizaciones desde SSMS y BIDSα DMX como lenguaje de consulta

Resumiendo

Page 13: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Va dividiendo los datos recursivamente en pequeños conjuntos

α Evalúa como cada atributo va dividiendo estos conjuntos, colocando en la parte superior los mas restrictivos.

α Es un algoritmo de clasificaciónα Puede ser usado con atributos continuosα Hay que tener cuidado con el sobre entrenamientoα Algunos parámetros

β MINIMUN_SUPPORTβ SCORE_METHODβ SPLIT_METHOD

AlgoritmosArboles de decisión

Page 14: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

DEMOArboles de decisión

Page 15: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Es un algoritmo fácil de entenderα Riego de sobre entrenamientoα Permite el uso de atributos continuos

Resumiendo

Page 16: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Es un algoritmo especialmente diseñado para el analisis de asociaciones

α Detecta reglas en nuestros datosβ Si A&&B C

α Cuenta la frecuencia de combinaciones de varios estados del atributo

α No utiliza probabilidadesα Cuando una combinación es muy frecuente, pasa a

ser una reglaα Parámetros:

β (MAXIMUN | MINIMUN)_ITEMSET_SIZEβ MAXIMUN_ITEMSET_COUNT

AlgoritmosReglas de asociación

Page 17: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

DEMOReglas de Asociación

Page 18: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Las reglas de asociación nos permite encontrar relaciones entre los valores de los atributos

α No es necesario que tengamos los valores en una tabla, podemos utilizar más de una

Resumiendo

Page 19: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Add-in para Excel 2007β Da problemas para Excel 2010β Solo para versiones de 32bits

α Permite realizar modelos de forma temporalβ Crea una base de datos multidimensional en ASβ Vuelca los modelos y estructuras en esa base de datos

α Es más fácil para el usuario

Excel como herramienta MD

Page 20: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

DEMOExcel como herramienta de Minería de Datos

Page 21: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

α Desde Excel podemos crear nuestros modelos de mineria

α Tenemos accesibles casi todas la funcionalidadα Podemos explorar los datosα No necesitamos almacenes en base de datos para

nuestros datos de mineria

Resumiendo

Page 22: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

Preguntas ?

Page 23: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

No olvideis rellenar las evaluaciones!Os invitamos al Solid Quality Summit

Mas de 60 sesiones técnicas todas alrededor de SQL Server y SharePoint (Madrid 6 al 10 de Junio), mas info en mi email o

en [email protected]

Sergio Carrillo VilaData Platform Engineer – Business Intelligence

Microsoft Business Management Specialist

Click here to add your MVP logo or MS Cert Logo

[email protected]

Page 24: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist

Gracias!Sergio Carrillo Vila

Data Platform Engineer – Business IntelligenceMicrosoft Business Management Specialist

Click here to add your MVP logo or MS Cert Logo

[email protected]

Page 25: Sergio Carrillo Vila Data Platform Engineer – Business Intelligence Microsoft Business Management Specialist