11
3/21/16 J.S.Ramos (@xuxoramos) 1 ¡Big Data, Big Flops! Flops, fumbles, bloopers y gag reel de cuando los algoritmos la riegan porque son programados por software developers sin bases estadísticasy que se lanzan al Machine Learning sin validar su realidad.Al principio es gracioso. Luego se vuelve pelogroso. Este subtítulo largo es intencional para emular un mensaje subliminal.

Data Day - Big data, big flops

Embed Size (px)

Citation preview

Page 1: Data Day - Big data, big flops

3/21/16 J.S.Ramos (@xuxoramos) 1

¡Big  Data,  Big  Flops!Flops,  fumbles,  bloopers  y  gag  reel  de  cuando  los  algoritmos  la  riegan  porque  son  programados  por  software  developers  sin  bases  estadísticas  y  que  se  lanzan  al  Machine  Learning   sin  validar  su  realidad.  Al  principio  es  gracioso.  Luego  se  vuelve  pelogroso.  Este  subtítulo  largo  es  intencional  para  emular  un  

mensaje  subliminal.

Page 2: Data Day - Big data, big flops

Idea  Radical

3/21/16 J.S.Ramos  (@xuxoramos) 2

“Los  peores  analistas  de  datos  son  desarrolladores  de  software”.

Page 3: Data Day - Big data, big flops

1.  The  Danger  Zone

3/21/16 J.S.Ramos  (@xuxoramos) 3

ComputerScience Math  &  Stats

Domain  Experience

DangerZone!

Cuando   los  software  devs  le  entran  al  Machine  Learning  sin  validación   estadística. Hacer  las  preguntas

correctas

Modelar  larealidad

OpsAnalytics

StatisticalLearning

DataScience

Predecirla  realidad

Page 4: Data Day - Big data, big flops

2.  Mindset

IT  &  SW  Dev IngenieríaCÓMO?

Analytics Estadística

PORQUÉ?

3/21/16 J.S.Ramos  (@xuxoramos) 4

Page 5: Data Day - Big data, big flops

Big  Flop  1

3/21/16 J.S.Ramos  (@xuxoramos) 5

“Reconocida  compañía  celular,  sin  saberlo,  presta  $  a  sospechosos”.

Page 6: Data Day - Big data, big flops

Big  Flop  2

3/21/16 J.S.Ramos  (@xuxoramos) 6

“Google  clasifica  a  2  personas  afro-­‐americana  como  ‘Gorillas’”.

Page 7: Data Day - Big data, big flops

Big  Flop  3

3/21/16 J.S.Ramos  (@xuxoramos) 7

“Google  Flu  Trends  predice  brote  de  influenza.  No  sucede.”

Page 8: Data Day - Big data, big flops

Big  Flop  4

3/21/16 J.S.Ramos  (@xuxoramos) 8

Page 9: Data Day - Big data, big flops

La  causa  raíz

3/21/16 J.S.Ramos  (@xuxoramos) 9

Encuesta  de  +200  profesionales  de  datos.  Aquellos  que  vienen  de  SoftwareDevelopment  mostraron  correlación  negativa  con  aquellos  de  negocio.  Este  es  el  problema  fundamental  de  la  IT.  Cuando  Esa  nube  roja  sea  un  óvalo  estrecho  de  pendiente  positiva  y  color  azul  rey,  Analytics  podrá  nacer  y  crecer  en  IT.

Page 10: Data Day - Big data, big flops

Cómo  lo  solucionamos?

3/21/16 J.S.Ramos  (@xuxoramos) 10

• Prepárate  en  estadística  y  mates.

• Lee  “Think  Stats”  de  Allen  Downey.

• Deja  de  ser  problem  automatizer  y  conviertete  en  

problem  solver.

• Acércate  a  tu  negocio  y  aprende  su  idioma.

• Aprende  R.

• No  le  entres  al  Machine  Learning  sin  base  estadística

Page 11: Data Day - Big data, big flops

3/21/16 J.S.Ramos  (@xuxoramos) 11

“Olvídense  de  R  vs  Python.  El  mejor  lenguaje  para  el  análisis  de  datos,  [sin  importar  escala  ni  sofisticación],  es  el  del  negocio”

@jokame

Conclusión