15
Big Data Tom Sawada [email protected] @TomasSawada

Tom Sawada - Intellignos - Big Data

Embed Size (px)

Citation preview

Big Data Tom Sawada [email protected] @TomasSawada

Que pensamos que es Big Data?

Que es Big Data?

Que es Big Data?

• Modelos estadísticos aceptados • Aplicado a un gran volumen de datos • Mismos desvíos, errores y outliers • Muchas veces montados sobre software • y otras veces, no…

Usar modelos estadísticos que probablemente ya aprendimos…

Análisis de correlación (Relación lineal)

R2:$0,7$R:$0,83$

R:$Grado$de$asociación$(fuerza)$entre$las$variables$$ R2:$Explicación$de$la$variación$de$una$variable$respecto$de$la$otra$

Del$siguiente$análisis$se$puede$visualizar$una$fuerte$relación$entre$las$visitas$y$la$Carga$del$CV.$En$donde$se$afirma$que$la$variable$“Visitas”$se$encuentra$relacionada$$linealmente$de$una$manera$fuerte$con$la$variable$dependiente$(0,8).$$De$acuerdo$a$R2$podemos$indicar$que$el$70%$de$la$Carga$del$CVs$son$explicadas$por$la$variable$independiente$Visitas.$

Del$siguiente$análisis$$puede$visualizar$una$fuerte$relación$entre$la$Registración$y$la$Carga$del$CV.$En$donde$se$afirma$que$la$variable$“Registrados”$se$encuentra$relacionada$en$forma$directa$con$la$variable$dependiente$$(0,83).$$A$través$de$R2$podemos$indicar$que$el$65%$de$la$Carga$del$CVs$son$explicadas$por$la$variable$independiente$Registros.$

Correlación$entre$Visitas$y$Carga$de$CV$

Correlación$entre$Registración$$y$Carga$de$CV$

y$=$0.3282x$+$3752.5$R²$=$0.65654$

0$5000$

10000$15000$20000$25000$30000$35000$40000$45000$

0$ 20000$ 40000$ 60000$ 80000$ 100000$

Carga$de

$CV$

Registrados$(Postulantes)$

R2:$0,65$R:$0,81$

y$=$0.0101x$+$938.61$R²$=$0.69465$

0$

10000$

20000$

30000$

40000$

50000$

$T$$$$ $1,000,000$$ $2,000,000$$ $3,000,000$$ $4,000,000$$

Carga$de

$CV$

Visitas$

Análisis de correlación (Relación lineal)

R2:$0,02$R:$0,14$

Del$siguiente$análisis$puede$visualizar$que$no$existe$una$relación$directa$entre$la$inversión$publicitaria$y$la$variables$independientes$(Visitas$y$Carga$de$CV$desde$tráfico$pago)$$

Análisis$de$Ia$inversión$publicitaria$(Google$Adwords)$vs.$El$volumen$de$visitas$y$el$volumen$de$Carga$de$CV$

$$0$

$$100,000$

$$200,000$

$$300,000$

$$400,000$

$G$$$$

$1,000,000$$

$2,000,000$$

$3,000,000$$

$4,000,000$$

JulG1

2$

AugG12$

SepG12$

OctG12$

NovG12$

DecG12

$

JanG13$

FebG13$

MarG13$

AprG13$

MayG13$

JunG13$

JulG1

3$

Visitas$ Inversión$Publicitaria$

y$=$G1.1113x$+$2E+06$R²$=$0.02139$

$G$$$$

$1,000,000$$

$2,000,000$$

$3,000,000$$

$4,000,000$$

$$0$$$50,000$$$100,000$$$150,000$$$200,000$$$250,000$$$300,000$$$350,000$$$400,000$

Visitas$

Inversión$Publicitaria$

$G$$$$

$2,000$$

$4,000$$

$6,000$$

$$0$

$$100,000$

$$200,000$

$$300,000$

$$400,000$

JulG1

2$

AugG12$

SepG12$

OctG12$

NovG12$

DecG12

$

JanG13$

FebG13$

MarG13$

AprG13$

MayG13$

JunG13$

JulG1

3$

Inversión$ Carga$de$CV$[TP]$

y$=$G0.0016x$+$3838.3$R²$=$0.01976$

$G$$$$

$1,000$$

$2,000$$

$3,000$$

$4,000$$

$5,000$$

$6,000$$

100,000$ 150,000$ 200,000$ 250,000$ 300,000$ 350,000$ 400,000$

Carga$CV

$[TP]$

Inversión$Publicitaria$

R2:$0,019$R:$0,14$

R:$Grado$de$asociación$(fuerza)$entre$las$variables$$ R2:$Explicación$de$la$variación$de$una$variable$respecto$de$la$otra$

Inversión$ Carga$CV$[TP]$

Visitas$ Inversión$

Cliente Mercenario (compra ofertas y se queja)

Cliente fidelizado (compra y recomienda)

Cliente Nuevo c/potenical (compró y se repagó)

Cliente nuevo s/potenical (compró oferta no se repagó)

Cliente perezoso (le cuesta volver, pero al hacerlo compra)

Cliente fisgón (mira mucho pero compra poco)

Cliente offline (termina la compra offline)

Cliente estacional (tiene períodos de compra)

Como se ven nuestros clientes?

Cliente Mercenario desinvertir

Cliente fidelizado cosechar

Cliente Nuevo c/potenical sembrar / invertir

Cliente nuevo s/potenical fomentar interés sin inversión

Cliente perezoso activar / mantener activo

Cliente fisgón generar interés y probar (testing!!!)

Cliente offline Generar UX ideal según tipo de consumo

Cliente estacional activar y desactivar según ciclo

Que hacemos con esto?

• Lo nuevo es el volumen de información, no la metodología.

• El software nos ayuda a correr los modelos, no a tomar decisiones.

• Importa quien está analizando la información.

Big Data es una coyuntura, no una práctica.

Gracias/Thank youTom Sawada Business Consultant [email protected]