Introducción a Modeler• Metodología CRISP-DM• Exploración del software
Extracción y carga de datos• Lectura de datos en formato Statistics, Excel, archivos de texto y bases de datos• Exploración de datos hacia archivos planos delimitados, de ancho fijo, Excel y bases de datos
Calidad de datos• Definición de tipos y medidas• Valores nulos• Valores atípicos y extremos• Tratamiento de casos
Manipulación de datos• Cálculo de variables• Variables agregadas• Reestructuración de datos• Operaciones con fechas, cadenas y números• Creación de intervalos• Estructuras de control• Operaciones secuenciales• Casos duplicados• Histograma y distribución• Caché de nodos• SQL Pushback
Parámetros de flujos• Configuración de parámetros• Aplicación de parámetros
Curso: Guía de contenidos
Aplicaciones específicas
Data Mining: Manipulación y Modelos
Encapsulamiento de procesos• Tipos de supernodos• Supernodos con parámetros
Automatización• Ejecución batch desatendida• Encriptación de contraseñas• Scripting de flujos con Python• Ejemplos de integración con R
Preparación de datos• Selección de casos• Transformaciones de datos• Variables predictoras y objetivo• Creación de particiones• Selección de predictores• Roles de variables
Algoritmos analíticos• K-medias• Árbol de decisión CHAID• Regresión logística
Medidas de evaluación• Gráficos de ganancia y ROC• Evaluación por KS y Gini• Estabilidad de la población
Carga horaria 20 horas
BeSmart ArgentinaMontañeses 2180 4° piso • Buenos Aires
(+54 11) 4784 2001 • [email protected]
BeSmart ChileMardoqueo Fernández 207 • Providencia • Santiago
(+56 2) 2415 3478 • [email protected]