38
Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science & Technology Karachi, Pakistan Dr. Tariq Mahmood PAF - Karachi Institute of Economics & Technology Karachi, Pakistan

Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Embed Size (px)

Citation preview

Page 1: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Using Predictive Analytics to Forecast Drone Attacks in Pakistan

Adailson de CastroMarcio Mendes

Uzma AfzalFederal Urdu University ofArts Science & TechnologyKarachi, Pakistan

Dr. Tariq MahmoodPAF - Karachi Institute ofEconomics & TechnologyKarachi, Pakistan

Page 2: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Roteiro

• Contextualização• Objetivo• Dados• Ferramentas• Preprocessamento• Modelagem e Forecasting• Conclusão

Page 3: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Drones• Unmanned Aerial Vehicles (UAV) or• Remotely Piloted Aerial Systems (RPAS).

• São empregados, no âmbito militar, em condições onde o vôo tripulado é considerado difícil e arriscado.

Page 4: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Drones

Page 5: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Drones

Page 6: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Objetivo• Aplicar tecnicas de previsão para medir futuros danos

• E prever ataques futuros para salvar vidas inocentes

Page 7: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Os Ataques

Page 8: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Fontes1. Pakistan Body Count (PBC) Website2. Cruzamentos das correspondencias

com1. entradas na wikipedia2. South Asia Terrorism Portal (SATP)

Website

• Cerca de 340 ataques registrados, desde Junho/2004 até junho/2013

Page 9: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Page 10: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Page 11: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Curtose

Obliquidade

Média

Page 12: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Número de ataques

JUN 2004 JUN 2013

Page 13: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Mortes de Militantes

JUN 2004 JUN 2013

Page 14: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Mortes de civis

JUN 2004 JUN 2013

Page 15: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Atributos

Feridos

JUN 2004 JUN 2013

Page 16: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

AtributosSobreposição

JUN 2004 JUN 2013

Numero de ataquesMortes de civisMortes de militantes

Obs.: Escala Aproximada

Page 17: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Série temporal EstacionáriaUma série temporal é dita estacionária quando ela se desenvolve no tempo aleatoriamente ao redor de uma média constante, refletindo alguma forma de equilíbrio estável. O que facilita a previsão.

Page 18: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

TransformaçãoNâo Estacionária -> estacionária

Diferenças sucessivas da série original

Primeira diferença:

Segunda diferença:

N-ésima diferença:

Page 19: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

TransformaçãoEstacionária -> Não estacionária

Diferenças sucessivas da série original

Page 20: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Trend

Trend, ou tendência , é o movimento de uma serie tempo a longo prazo

Exemplo

Page 21: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

SeasonSeasonality, ou sazonalidade , é o movimento de uma serie temporal em intervalos menores que um ano. Mensalmente, semanalmente, diariamente , e.g.

Exemplo

Page 22: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

TransformaçãoEstacionária -> Não estacionária

Não é dito no artigo, mas provavelmente foram feitos testes de estacionaridade nas series temporais dos 4 parâmetros. Provavelmente também foi descoberto que as mesmas eram não estacionárias (um tanto quanto óbvio pelos gráficos), por isso a necessidade de se aplicar a transformação por uma função de diferenciação. Como é dito no artigo:

“In all four graphs, the mean value ischanging across different time periods, signaling the need to

apply a differencing function across consecutive timePeriods [...]”

Page 23: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Partial Autocorrelation function (PACF)

É usado uma função de auto correção parcial(Partial Auto correlation function, PACF) para identificar a extensão do “lag”(atraso) no modelo

Seja um valor da serie temporal no tempo t:

Auto correlação parcial do lag 1:

Auto correlação parcial do lag k:

Page 24: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Partial Autocorrelation function (PACF)

Page 25: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

IBM SPSS Tool

Exponential Smoothing

Autoregressive Integrated Moving Average (ARIMA)

AutomatedExpert Modeler

Page 26: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Exponential Smoothing

+(1- )

𝑆0=𝑋 0

0<<1

Smoothing Factor (“Fator Suavizante”, tradução livre)

Previsão no tempo “t”

Valor observado no instante inicial

Page 27: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

ARIMAAutoregressive Integrated Moving Average

(1−∑𝑖=1𝑝

𝜑𝑖𝐿𝑖) (1− 𝐿)𝑑𝑋 𝑡=𝛿+(1+∑𝑖=1

𝑞

𝜃𝑖𝐿𝑖)𝜀𝑡

Modelo ARIMA (p, d, q) ARIMA (autoregressive, Integrated, Moving)

Lag Operator Erro

Número de parâmetrosauto-regressivos,

Número de diferenças número de parâmetros da média móvel

𝐿𝑖=𝑋 𝑡 −𝑖/ 𝑋 𝑡𝑋 𝑡−𝑋 𝑡− 1=𝜀𝑡

Page 28: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

ARIMAAutoregressive Integrated Moving Average

(1−∑𝑖=1𝑝

𝜑𝑖𝐿𝑖) (1− 𝐿)𝑑𝑌 𝑡=𝛿+(1+∑𝑖=1

𝑞

𝜃𝑖𝐿𝑖)𝜀𝑡

𝑌 𝑡 ¿ (1−𝐿 )𝑑 𝑋 𝑡

𝑌 𝑡=(𝛿+(1+∑𝑖=1𝑞

𝜃 𝑖𝐿𝑖)𝜀𝑡) /((1−∑𝑖=1

𝑝

𝜑𝑖𝐿𝑖)(1−𝐿 )𝑑  )

Page 29: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Dados observados vs Forecast

Dados observadosForecast

Expert Modeler

Page 30: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Dados observadosForecast

ARIMA Modelado Manualmente

Dados observados vs Forecast

Page 31: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Comparação de erros

Root Mean Squared Error (RMSE)

Page 32: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Dados observados Forecast

Expert Modeler

Page 33: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

ARIMA Modelado Manualmente

Page 34: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Forecast

Page 35: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Forecast• Julho 2013: 2(ataques), 17

(militantes), 2(estrangeiros), 0 (feridos)

• Agosto 2013: Não houve ataques• Setembro 2013: 3(ataques), 6

(militantes), 12(civis e estrangeiros), 9 (feridos)

• Outubro 2013: 2(ataques), 5 (militantes), 3(civis), 5 (feridos)

• Novembro 2013: 2(ataques), 2 (militantes), 6(civis e estrangeiros), 10 (feridos)

• Dezembro 2013: 2(ataques), 0 (militantes), 9(civis), 3 (feridos)

Page 36: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Comparação do ARIMA e EM em 2012

Page 37: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Conclusão• O Expert Modeler, no IBM SPSS, se mostrou melhor, com menos erros que o ARIMA Modelado Manualmente.

• Os ataques tem grande número de civis mortos comparados com as mortes de militantes.

Page 38: Using Predictive Analytics to Forecast Drone Attacks in Pakistan Adailson de Castro Marcio Mendes Uzma Afzal Federal Urdu University of Arts Science &

Obrigado, dúvidas?