Informe MINERIA de DATOS Rodriguez Oscar - Enviar

Embed Size (px)

Citation preview

UNIVERSIDAD TCNICA DEL NORTEFICACISICOPTATIVA IINFORME MINERA DE DATOS

INTEGRANTE: Oscar Rodrguez

NIVEL: 8to A

FECHA: 2014-07-0910

LECCIN 1Cada proyecto de Microsoft SQL Server Analysis Services define el esquema para los objetos de una base de datos de Analysis Services individual. Una base de datos de Analysis Services contiene estructuras de minera de datos y modelos de minera de datos, modelos multidimensionales (cubos) y objetos de ayuda, como orgenes de datos y vistas de los orgenes de datos. En este tutorial usar la base de datos AdventureWorksDW2012 como origen de datos. Implementar los objetos de minera de datos en una base de datos de Analysis Services denominada BasicDataMining.Origen de Datos

Vista de Origen de Datos

ProspectiveBuyer (dbo): la tabla de compradores probables de una bicicleta vTargetMail (dbo): la vista de datos histricos sobre los compradores de una bicicleta en el pasado

LECCIN 2Crear una estructura del modelo de minera de datos de distribucin de correo directoEspecificar el tipo de datos y el tipo de contenidos

Especificar un conjunto de datos de pruebas para la estructura

Especificar la obtencin de detalles

Agregar los modelos nuevos a la estructura de correo de destinoEn esta tarea, definir dos modelos adicionales mediante la pestaa Modelos de minera de datos del Diseador de minera de datos. Para crear los modelos, se usarn el algoritmo Bayes naive y el algoritmo de clsteres de Microsoft. Estos dos algoritmos se han seleccionado debido a su capacidad de predecir un valor discreto (por ejemplo, la compra de una bicicleta).

Procesar los modelos de la estructura de distribucin de correo directoAl implementar un proyecto y procesar la estructura y los modelos, a las filas individuales de la estructura de datos se les asigna de forma aleatoria el conjunto de pruebas y entrenamiento a partir de un valor de inicializacin del nmero aleatorio. Normalmente, el valor de inicializacin del nmero aleatorio se calcula con los atributos de la estructura de datos. Teniendo en cuenta los fines de este tutorial, para asegurarse de que los resultados son los mismos que los descritos aqu, asignaremos arbitrariamente un valor de inicializacin de exclusin fijo de 12. El valor de inicializacin de exclusin se utiliza para inicializar el muestreo aleatorio y asegurarse de que los datos se dividen aproximadamente de la misma manera para todas las estructuras de minera de datos y sus modelos.Establece el valor de inicializacin de exclusin

Implementar y Procesar los modelos

LECCIN 4Explorar el modelo de rbol de decisin Pestaa rbol de decisinEn la pestaa rbol de decisin, puede examinar los tres modelos de rbol que componen un modelo de minera de datos.Dado que el modelo de correo directo incluido en este proyecto de tutorial contiene un nico atributo de prediccin, Bike Buyer, solo se puede ver un rbol. Si hubiera ms rboles, podra utilizar el cuadro rbol para elegir uno diferente.Al examinar el modelo TM_Decision_Tree en el Visor de rbol de decisin observamos que la edad es el nico factor ms importante a la hora de predecir la compra de bicicletas. Es interesante ver que al agrupar los clientes por edad, la siguiente rama del rbol es diferente para cada nodo de edad. Al explorar la pestaa rbol de decisin podemos concluir que los compradores con una edad comprendida entre 34 y 40 aos con uno o varios automviles tienen ms probabilidades de comprar una bicicleta, al igual que los clientes jvenes y solteros que viven en la regin del Pacfico y que no tienen automvil o tienen uno. Pestaa red de dependencias

Explorar el modelo de agrupacin de clsteres Pestaa Diagrama del clster

Pestaa caractersticas del clster

Pestaa Distincin del clster

Explorar el modelo Bayes naive Red de dependencias

Caractersticas del atributo

Distincin del atributoLa pestaa Distincin del atributo le permite examinar las relaciones entre dos valores discretos de la compra de una bicicleta y otros valores del atributo. Dado que el modelo TM_NaiveBayes solo tiene dos estados, 1 y 0, no tiene que hacer ningn cambio en el visorLECCIN 5Probar la exactitud con grficos de mejora respecto al modelo predictivo Elegir datos de entrada

Probar un modelo filtrado Filtros en tablas de casos

Evaluar los resultados

Para probar la mejora en la prediccin de los modelos filtrados

LECCIN 6Crear Predicciones Crear la consulta Asignar las columnas

Disear la consulta de prediccinLa pestaa Prediccin de modelo de minera de datos muestra informacin de contacto para los clientes potenciales que son probables compradores de bicicletas. La columna Probabilidad de resultado indica la probabilidad de que la prediccin sea correcta. Puede utilizar estos resultados para determinar a qu clientes potenciales debe dirigirse en el correo.