186
Datata www.datata.mx Delitos Ciencia de Datos Semana de Matemáticas ITAM 2014 Omar Trejo Navarro Luis M. Román García

1st. place - Datatón 2014 - Data Science National Contest, Mexico

Embed Size (px)

Citation preview

Page 1: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

DelitosCiencia de Datos

Semana de MatemáticasITAM 2014

Omar Trejo Navarro Luis M. Román García

Page 2: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

¿Es racional cometer delitos?

Page 3: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

Page 4: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

Beneficio

Page 5: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

Castigo

Beneficio

Page 6: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

} El delito no es racionalCastigo

Beneficio

Page 7: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

Castigo

Beneficio

} El delito no es racional

Page 8: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

Castigo

Beneficio

} El delito no es racional

Page 9: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

Castigo

Beneficio

} El delito no es racional

Page 10: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

Castigo

Beneficio

} El delito no es racional

Page 11: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

Castigo

Beneficio

} El delito no es racional

Page 12: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

}Castigo

Beneficio

El delito no es racional

Page 13: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

}Castigo

Beneficio

El delito no es racional

Page 14: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Utilidad

Gravedad

}

Delinquir es racional

Castigo

Beneficio

El delito no es racional

Page 15: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

CIDAC 2009

Page 16: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

100

Delitos

CIDAC 2009

Page 17: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

100 25

Delitos Reportan

CIDAC 2009

Page 18: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

100 25 4.5

Delitos InvestiganReportan

CIDAC 2009

Page 19: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

100 25 4.5 1.6

Delitos JuezInvestiganReportan

CIDAC 2009

Page 20: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

100 25 4.5 1.6 1.2

Delitos JuezInvestiganReportan Sentencia

CIDAC 2009

Page 21: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

100 25 4.5 1.6 1.2 1

Delitos JuezInvestiganReportan Sentencia Condena

CIDAC 2009

Page 22: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

¡Se condena a 1%!

Page 23: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

“En México todos los delitos son rentables”

— Enrique García Tejeda

Page 24: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Problemas alrededor de los delitos

Complejidad procesalDiscrecionalidadInformación

CorrupciónLitigiosidadTecnología

— Enrique García Tejeda

Page 25: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Problemas alrededor de los delitos

Complejidad procesalDiscrecionalidadInformación

CorrupciónLitigiosidadTecnología

— Enrique García Tejeda

Page 26: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Ciencia de Datos

Page 27: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Ciencia de DatosMatemáticas

Page 28: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Ciencia de DatosMatemáticas Estadística

Page 29: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Ciencia de DatosMatemáticas Estadística Computación

Page 30: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Datatón

Page 31: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Concurso Nacional

Datatón

Page 32: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Concurso Nacional

Presidencia de la RepúblicaDatatón

Page 33: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Concurso Nacional

Presidencia de la República

Política Pública

Datatón

Page 34: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

“Predicción de delitos y análisis en tiempo real del municipio de Zapopan con Twitter y Google”

Page 35: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención Reacción

Page 36: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención Reacción

Page 37: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención

Page 38: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

PrevenciónAsignar probabilidad de ocurrencia

Page 39: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

PrevenciónAsignar probabilidad de ocurrencia

Determinar variables relevantes

Page 40: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Intuición

Page 41: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

¿Cuántas pelotas hay?

Page 42: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

= T

¿Cuántas pelotas hay?

Page 43: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Recopilemos opiniones

= T

¿Cuántas pelotas hay?

Page 44: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Recopilemos opiniones

= T

X1

¿Cuántas pelotas hay?

Page 45: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Recopilemos opiniones

= TX2

X1

¿Cuántas pelotas hay?

Page 46: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Recopilemos opiniones

= TX2

X3X1

¿Cuántas pelotas hay?

Page 47: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Recopilemos opiniones

= TX2

X3X1

Xj

¿Cuántas pelotas hay?

Page 48: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Recopilemos opiniones

= TX2

X3X1

Xn

Xj

¿Cuántas pelotas hay?

Page 49: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

¿Cómo funciona?

Page 50: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

¿Cómo funciona?Ajuste de importancia

Page 51: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

¿Cómo funciona?Ajuste de importancia

Enfoque en los difíciles

Page 52: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoost Freund y Schapire, 1997

Page 53: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados

Freund y Schapire, 1997

Page 54: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados donde

Freund y Schapire, 1997

Page 55: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados donde Inicializar

Freund y Schapire, 1997

Page 56: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados donde InicializarPara :

Freund y Schapire, 1997

Page 57: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados donde InicializarPara :● Entrenar al predictor débil usando la distribución

Freund y Schapire, 1997

Page 58: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados donde InicializarPara :● Entrenar al predictor débil usando la distribución● Obtener la hipótesis débil

Freund y Schapire, 1997

Page 59: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados donde InicializarPara :● Entrenar al predictor débil usando la distribución● Obtener la hipótesis débil con error .

Freund y Schapire, 1997

Page 60: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados donde InicializarPara :● Entrenar al predictor débil usando la distribución● Obtener la hipótesis débil con error .● Escoger

Freund y Schapire, 1997

Page 61: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados donde InicializarPara :● Entrenar al predictor débil usando la distribución● Obtener la hipótesis débil con error .● Escoger

● Actualizar

Freund y Schapire, 1997

Page 62: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados donde InicializarPara :● Entrenar al predictor débil usando la distribución● Obtener la hipótesis débil con error .● Escoger

● Actualizar

Freund y Schapire, 1997

Page 63: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados donde InicializarPara :● Entrenar al predictor débil usando la distribución● Obtener la hipótesis débil con error .● Escoger

● Actualizar

Hipótesis final: .

Freund y Schapire, 1997

Page 64: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Algoritmo — AdaBoostDados donde InicializarPara :● Entrenar al predictor débil usando la distribución .● Obtener la hipótesis débil con error .● Escoger

● Actualizar

Hipótesis final: . es un factor de normalización para .

Freund y Schapire, 1997

Page 65: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Page 66: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Page 67: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Page 68: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Entrenamos un predictor débil (árbol) con

Page 69: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Entrenamos un predictor débil (árbol) con

Page 70: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Entrenamos un predictor débil (árbol) con

Page 71: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Entrenamos un predictor débil (árbol) con

Page 72: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Entrenamos un predictor débil (árbol) con

Page 73: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Entrenamos un predictor débil (árbol) con

Page 74: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Entrenamos un predictor débil (árbol) con

Page 75: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Entrenamos un predictor débil (árbol) con

Error

Page 76: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Entrenamos un predictor débil (árbol) con

PesosError

Page 77: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Entrenamos un predictor débil (árbol) con

¡Debe ser mejor que clasificar aleatoriamente!

PesosError

Page 78: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Page 79: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Pesos bajos a las muestras bien clasificadas.

Page 80: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Pesos altos a las muestras mal clasificadas.

Esquemáticamente

Pesos bajos a las muestras bien clasificadas.

Page 81: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Page 82: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Esquemáticamente

Page 83: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Pesos grandes

Pesos chicos

Esquemáticamente

Page 84: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Pesos grandes

Pesos chicos

Asignamos mayor peso a los mejores clasificadores.

Esquemáticamente

Page 85: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Parámetros

Page 86: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

ParámetrosNúmero de iteraciones

Page 87: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

ParámetrosNúmero de iteracionesProfundidad del árbol

Page 88: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

ParámetrosNúmero de iteracionesProfundidad del árbolTasa de aprendizaje

Page 89: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

ParámetrosNúmero de iteracionesProfundidad del árbolTasa de aprendizajeTamaño de muestra

Page 90: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

¿Cuál es el error?

Page 91: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Suponiendo que cada es mejor que adivinar al azar

Page 92: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Suponiendo que cada es mejor que adivinar al azar

Page 93: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Suponiendo que cada es mejor que adivinar al azar

Page 94: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Suponiendo que cada es mejor que adivinar al azar

, donde es el peso de la predicción .

Page 95: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Suponiendo que cada es mejor que adivinar al azar

, donde es el peso de la predicción .

Si es el error de clasificación de un predictor:

Page 96: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Suponiendo que cada es mejor que adivinar al azar

, donde es el peso de la predicción .

Freund y Schapire, 1997

Si es el error de clasificación de un predictor:

Page 97: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

En boosting el error de entrenamiento puede hacerse arbitrariamente pequeño.

Page 98: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Modelo finalIteraciones: 14

Page 99: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Modelo finalIteraciones: 14

Muestra de prueba: 7,501

Page 100: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Modelo finalIteraciones: 14

Muestra de prueba: 7,501 Muestra de entrenamiento: 2,499

Page 101: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Variables y observaciones

Page 102: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Parámetros Valores

Tasa de aprendizaje .1, .01

Profundidad árboles 1, 3, 5, 7

Sensibilidad 100, 150, 200, … , 1000

Error de generalización Bootstrap (25 reps)

Remuestreo

Page 103: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Parámetros Valores

Tasa de aprendizaje .1, .01

Profundidad árboles 1, 3, 5, 7

Sensibilidad 100, 150, 200, … , 1000

Error de generalización Bootstrap (25 reps)

Remuestreo

Contracción Profundidad N-árboles Precisión Kappa Precisión DS Kappa DS

.1 1 100 .904 0 .00424 0

.1 1 150 .906 0.037 .00465 .0236

.1 1 200 .906 0.074 .004 .0248

... ... ... ... ... ... ...

.01 7 1000 .966 .803 .00306 .0175

Page 104: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Parámetros Valores

Tasa de aprendizaje .1, .01

Profundidad árboles 1, 3, 5, 7

Sensibilidad 100, 150, 200, … , 1000

Error de generalización Bootstrap (25 reps)

Remuestreo

Contracción Profundidad N-árboles Precisión Kappa Precisión DS Kappa DS

.1 1 100 .904 0 .00424 0

.1 1 150 .906 0.037 .00465 .0236

.1 1 200 .906 0.074 .004 .0248

... ... ... ... ... ... ...

.01 7 1000 .966 .803 .00306 .0175

Shrinkage: .01 Depth: 7 N-trees: 700

Page 105: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Resultados

Page 106: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Page 107: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Medida Valor

Precisión 96.96%

Valor-p p < 2e-16

Sensibilidad .9845

Especificidad .8277

Kappa 0.8215

Prevalencia 0.9048

Precisión balanceada 0.9061

Page 108: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención

Page 109: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención

Lo bueno

Page 110: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención

Lo buenoRelaciones implícitas

Page 111: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención

Lo buenoRelaciones implícitasPerfiles por zona

Page 112: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención

Lo buenoRelaciones implícitasPerfiles por zonaIntuición

Page 113: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención

Lo buenoRelaciones implícitasPerfiles por zonaIntuición

Lo malo

Page 114: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención

Lo buenoRelaciones implícitasPerfiles por zonaIntuición

Lo maloDesbalance

Page 115: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención

Lo buenoRelaciones implícitasPerfiles por zonaIntuición

Lo maloDesbalanceNo. de predictores

Page 116: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención

Lo buenoRelaciones implícitasPerfiles por zonaIntuición

Lo maloDesbalanceNo. de predictoresDatos imprecisos

Page 117: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Política pública inteligente

Page 118: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reducción de delitos

Page 119: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Prevención Reacción

Page 120: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción

Page 121: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción1. Monitoreo

Page 122: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción1. Monitoreo2. Detección

Page 123: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción1. Monitoreo2. Detección

3. Información

Page 124: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción1. Monitoreo2. Detección

3. Información4. Coordinación

Page 125: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Page 126: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Page 127: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Policía

Page 128: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 129: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 130: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 131: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 132: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 133: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 134: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 135: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 136: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 137: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 138: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 139: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 140: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Page 141: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Monitoreo

Page 142: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Monitoreo

Page 143: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Monitoreo

Page 144: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez

Monitoreo

Page 145: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez

Monitoreo

Page 146: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez

DetecciónMonitoreo

Page 147: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez

Monitoreo Detección

Page 148: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez

Monitoreo Detección

Page 149: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez Patrulla a...

Monitoreo Detección

Page 150: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez Patrulla a...

Monitoreo Detección

Page 151: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez Patrulla a...

Monitoreo Detección

Page 152: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez Patrulla a...

Listos para...

Monitoreo Detección

Page 153: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez Patrulla a...

Listos para...

Monitoreo Detección Coordinación

Page 154: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez Patrulla a...

Listos para...

Monitoreo Detección Coordinación

Page 155: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez

Instrucciones

Patrulla a...

Listos para...

Monitoreo Detección Coordinación

Page 156: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez

Instrucciones

Patrulla a...

Listos para...

Monitoreo Detección Coordinación

Información

Page 157: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez

Instrucciones

Patrulla a...

Listos para...

API REST de Twitter

Monitoreo Detección Coordinación

Información

Page 158: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez

Instrucciones

Patrulla a...

Listos para...

API REST de Twitter

Monitoreo Detección Coordinación

Información

Page 159: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Hospitales

Policía

Homicidio en jiménez y valdez

Instrucciones

Patrulla a...

Listos para...

API REST de Twitter

API Directions

JSON

Monitoreo Detección Coordinación

Información

Page 160: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Coordinación en tiempo real

Page 161: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Salvar vidas

Page 162: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Participación ciudadana

Page 163: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Más información

Page 164: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Mapas de criminalidad

Page 165: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

¿Cómo funciona?

Page 166: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

API de Twitter

Page 167: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

API de Twittertweets <- searchTwitter(

keyword = keyword, geocode = geozone, since = since.date, n = number.tweets)

Page 168: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

API de Twitter

twitteR

tweets <- searchTwitter(keyword = keyword, geocode = geozone, since = since.date, n = number.tweets)

Page 169: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

API de GoogleAPI de Twitter

twitteR

tweets <- searchTwitter(keyword = keyword, geocode = geozone, since = since.date, n = number.tweets)

Page 170: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

API de GoogleAPI de Twitterurl <- paste(“http://maps.googleapis.com/maps/api/directions/json?”,“origin=”, from.coord, “&destination=”, to.coord, “&language=”, lang.code, sep = “”)

twitteR

tweets <- searchTwitter(keyword = keyword, geocode = geozone, since = since.date, n = number.tweets)

Page 171: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

API de GoogleAPI de Twittertweets <- searchTwitter(

keyword = keyword, geocode = geozone, since = since.date, n = number.tweets)

twitteR

url <- paste(“http://maps.googleapis.com/maps/api/directions/json?”,“origin=”, from.coord, “&destination=”, to.coord, “&language=”, lang.code, sep = “”)

route <- fromJSON( paste(readLines(url), collapse = “”))

Page 172: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Ejemplohttps://maps.googleapis.com/maps/api/directions/json?origin=ITAM,Mexico&destination=UNAM,Mexico&language=es

Page 173: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción

Page 174: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción

Lo bueno

Page 175: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción

Lo buenoInmediato

Page 176: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción

Lo buenoInmediatoAutomático

Page 177: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción

Lo buenoInmediatoAutomáticoEscalable

Page 178: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción

Lo buenoInmediatoAutomáticoEscalable

Lo malo

Page 179: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción

Lo buenoInmediatoAutomáticoEscalable

Lo maloNo robusto

Page 180: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción

Lo buenoInmediatoAutomáticoEscalable

Lo maloNo robustoNo factor-humano

Page 181: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Reacción

Lo buenoInmediatoAutomáticoEscalable

Lo maloNo robustoNo factor-humanoErrores costosos

Page 182: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Demostración

Page 183: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Código abierto

Page 184: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Ciencia abiertaCódigo abierto

Page 185: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

www.datata.mx

Datatahttps://github.com/datata/dataton

Page 186: 1st. place - Datatón 2014 - Data Science National Contest, Mexico

Datata www.datata.mx

Referencias[1] Enrique García Tejeda, Análisis Económico del Derecho Penal,

Clase de licenciatura en la Universidad Panamericana

[2] Gary Becker, Crime and Punishment, An Economic Approach

http://www.nber.org/chapters/c3625.pdf

[3] Yoav Freund and Robert Schapire, A Short Introduction to Boosting

http://cseweb.ucsd.edu/~yfreund/papers/IntroToBoosting.pdf

[4] Twitter, REST API v1.1 Resources,

https://dev.twitter.com/docs/api/1.1

[5] Google, The Google Directions API,

https://developers.google.com/maps/documentation/directions/