Upload
software-guru
View
183
Download
6
Embed Size (px)
Citation preview
3/21/16 J.S.Ramos (@xuxoramos) 1
¡Big Data, Big Flops!Flops, fumbles, bloopers y gag reel de cuando los algoritmos la riegan porque son programados por software developers sin bases estadísticas y que se lanzan al Machine Learning sin validar su realidad. Al principio es gracioso. Luego se vuelve pelogroso. Este subtítulo largo es intencional para emular un
mensaje subliminal.
Idea Radical
3/21/16 J.S.Ramos (@xuxoramos) 2
“Los peores analistas de datos son desarrolladores de software”.
1. The Danger Zone
3/21/16 J.S.Ramos (@xuxoramos) 3
ComputerScience Math & Stats
Domain Experience
DangerZone!
Cuando los software devs le entran al Machine Learning sin validación estadística. Hacer las preguntas
correctas
Modelar larealidad
OpsAnalytics
StatisticalLearning
DataScience
Predecirla realidad
2. Mindset
IT & SW Dev IngenieríaCÓMO?
Analytics Estadística
PORQUÉ?
3/21/16 J.S.Ramos (@xuxoramos) 4
Big Flop 1
3/21/16 J.S.Ramos (@xuxoramos) 5
“Reconocida compañía celular, sin saberlo, presta $ a sospechosos”.
Big Flop 2
3/21/16 J.S.Ramos (@xuxoramos) 6
“Google clasifica a 2 personas afro-‐americana como ‘Gorillas’”.
Big Flop 3
3/21/16 J.S.Ramos (@xuxoramos) 7
“Google Flu Trends predice brote de influenza. No sucede.”
Big Flop 4
3/21/16 J.S.Ramos (@xuxoramos) 8
La causa raíz
3/21/16 J.S.Ramos (@xuxoramos) 9
Encuesta de +200 profesionales de datos. Aquellos que vienen de SoftwareDevelopment mostraron correlación negativa con aquellos de negocio. Este es el problema fundamental de la IT. Cuando Esa nube roja sea un óvalo estrecho de pendiente positiva y color azul rey, Analytics podrá nacer y crecer en IT.
Cómo lo solucionamos?
3/21/16 J.S.Ramos (@xuxoramos) 10
• Prepárate en estadística y mates.
• Lee “Think Stats” de Allen Downey.
• Deja de ser problem automatizer y conviertete en
problem solver.
• Acércate a tu negocio y aprende su idioma.
• Aprende R.
• No le entres al Machine Learning sin base estadística
3/21/16 J.S.Ramos (@xuxoramos) 11
“Olvídense de R vs Python. El mejor lenguaje para el análisis de datos, [sin importar escala ni sofisticación], es el del negocio”
@jokame
Conclusión