33
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Szeregi czasowe Filtry Autokorelacja i modele ARIMA Analiza danych prof. UAM dr hab. Tomasz Górecki [email protected] http://drizzt.home.amu.edu.pl Zakład Statystyki Matematycznej i Analizy Danych Wydział Matematyki i Informatyki Uniwersytet im. Adama Mickiewicza w Poznaniu Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Analiza danych

prof. UAM dr hab. Tomasz Gó[email protected]

http://drizzt.home.amu.edu.pl

Zakład Statystyki Matematycznej i Analizy DanychWydział Matematyki i Informatyki

Uniwersytet im. Adama Mickiewicza w Poznaniu

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 2: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Wprowadzenie

Analizę dynamiki zjawisk masowych przeprowadza się na podstawieszeregów czasowych (ang. time series). Są to ciągi (Yt) wartościbadanego zjawiska obserwowanego w kolejnych jednostkach czasu.Zmienną niezależną jest czas, a zmienną zależną – wartościliczbowe badanego zjawiska.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 3: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Szeregi czasowe w R

Do konstrukcji szeregu czasowego wykorzystywana jest funkcja ts.Jeśli mamy już szereg czasowy, to możemy uzyskać z niego wieleinformacji. Wykorzystywane są do tego następujące funkcje: start(początkowy okres), end (końcowy okres), frequency (liczbapodokresów), deltat (odstęp czasowy pomiędzy obserwacjami, np.dla miesięcy mamy 1/12), time (wektor czasów, w których mamyobserwacje z szeregu). Do wizualizacji danych zebranych w postaciszeregu czasowego służy funkcja ts.plot, której argumentem możebyć kilka szeregów czasowych (zostaną zwizualizowane na jednymwykresie).

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 4: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Daty w R

Podstawowe funkcje to: Sys.time (data wraz z godziną), Sys.Date(data bez godziny). Do wprowadzania danych jako dat służyfunkcja as.Date, której argumentem jest data. Domyślny formatdaty, to cztery cyfry na rok, dwie na miesiąc i dwie na dzień,oddzielone kreską lub ukośnikiem. Jeśli chcemy użyćniestandardowego formatu, należy go wyspecyfikować jako wartośćparametru format według oznaczeń zawartych w poniższej tabeli.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 5: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Daty w R

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 6: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Daty w R

Data przechowywana jest jako liczba dni, jaka upłynęła od 1stycznia 1970 roku (POSIXct). Można również podać datę jakoliczbę dni, która upłynęła od pewnej daty początkowej. Jeślichcemy się dowiedzieć, jakim dniem, miesiącem lub kwartałem jestdana data możemy użyć funkcji weekdays, months oraz quarters.Często możemy być zainteresowani jaka była różnica pomiędzydwoma datami. W R różnicę tę możemy wyrazić w sekundach,minutach, godzinach, dniach i miesiącach używając funkcji difftimei określając parametr units na secs, mins, hours, days, weeksodpowiednio. Przy konstrukcji szeregów czasowych potrzebne namsą sekwencje dat. Można je z łatwością utworzyć korzystająca zpoznanej wcześniej funkcji seq z wykorzystaniem jej parametru by,który może przyjmować wartości będące jednostkami czasowymi.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 7: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Model wahań w czasie

Modelem wahań w czasie nazywamy konstrukcję teoretycznąopisującą kształtowanie się określonego zjawiska jako funkcjęczasu, wahań okresowych (periodycznych) i przypadkowych(nieregularnych). Tradycyjnie analizy prawidłowości w rozwojuzmiennej dokonuje się poprzez wyodrębnianie w szeregu czasowymjego elementów składowych, co nosi nazwę dekompozycji tegoszeregu. W najogólniejszym przypadku zakłada się, że w szereguczasowym mogą wystąpić cztery składniki:

1 trend – Tt,2 wahania cykliczne – Ct,3 wahania sezonowe – St,4 wahania nieregularne, przypadkowe – It.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 8: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Model wahań w czasie

Trend charakteryzuje długookresową tendencję zmian w szereguczasowym. Może on oznaczać w miarę regularnie powtarzający sięwzrost lub spadek wartości zmiennej Y lub też brak wyraźnejtendencji zmian. Pozostałe trzy składniki szeregu czasowego toróżnego typu odchylenia od tendencji długookresowej. Wahaniacykliczne oznaczają powtarzające się (niekoniecznie regularnie)wahania o czasie trwania dłuższym niż rok. Wahania sezonoweoznaczają takie odchylenia od trendu, które powtarzają się wczasie w sposób regularny i których pełen cykl zawiera się w ciągujednego roku. Wahania sezonowe powtarzają się według pewnego„wzorca” każdego roku. Wahania sezonowe kształtowane są przezczynniki naturalne (pory roku, pogodę) oraz przez zwyczaje (np.różne święta). Wahania nieregularne (losowe) to te, któreobejmują wszelkie odchylenia od trendu, będące efektem działaniana badaną zmienną niepowtarzalnych, nie dających się przewidziećani prognozować zdarzeń.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 9: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Trend

Tendencją rozwojową (trendem) nazywamy powolne, regularne isystematyczne zmiany określonego zjawiska, obserwowane wdostatecznie długim przedziale czasu i będące wynikiem działaniaprzyczyn głównych. Przyjmuje się, że aby wyodrębnić trend,niezbędne są co najmniej 10-letnie badania. Wyróżniamy dwiemetody wyodrębniania tendencji rozwojowej szeregów czasowych:

Metoda mechaniczna – opiera się na średnich ruchomych.Polega ona na zastąpieniu danych empirycznych średnimipoziomami z okresu badanego i kilku okresów sąsiednich.Średnie ruchome mogą być obliczane z parzystej bądźnieparzystej liczby wyrazów sąsiednich.Metoda analityczna – polega na dopasowaniu określonejfunkcji matematycznej do całego szeregu czasowego zapomocą MNK. Istotny jest wybór klasy funkcji trendu orazprawidłowe oszacowanie jej parametrów.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 10: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Średnia ruchoma

Dla przykładu średnie ruchome trzyokresowe (k = 3) obliczamynastępująco:

Y2 =Y1 + Y2 + Y3

3 ,

Y3 =Y2 + Y3 + Y4

3 ,

. . . ,

Yn−1 =Yn−2 + Yn−1 + Yn

3 .

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 11: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Średnia ruchoma

Natomiast w przypadku średniej ruchomej dla parzystej liczbyokresów (k = 4) obliczenia wykonujemy według wzorów:

Y3 =12Y1 + Y2 + Y3 + Y4 +

12Y5

4 ,

Y4 =12Y2 + Y3 + Y4 + Y5 +

12Y6

4 ,

. . . ,

Yn−2 =12Yn−4 + Yn−3 + Yn−2 + Yn−1 +

12Yn

4 .

Zaletą tej metody jest prostota obliczeń, wadą natomiast jestskracanie wyrównanego tą metodą szeregu czasowego. W naszymprzypadku dla k = 3 tracimy element pierwszy i ostatni, a dlak = 4 tracimy dwa pierwsze i dwa ostatnie.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 12: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Filtry wygładzające

Oprócz najprostszej metody średniej ruchomej można zastosować,dużo bardziej wyrafinowane metody zwane filtrami. Donajpopularniejszych należą filtr liniowy oraz wykładniczy. Filtrliniowy ma postać:

Yt =1

2a + 1

a∑i=−a

Yt+i.

Jest to w zasadzie nieco zmodyfikowana średnia ruchoma.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 13: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Filtry wygładzające

Filtr wykładniczy, który bywa również nazywany wygładzaniemwykładniczym Browna, opiera się na założeniu, że wartośćszeregu czasowego powinna bardziej zależeć od obserwacji bliskichniż dalekich, co daje

Yt+1 = αYt−1 + (1 − α)Yt.

Istotny jak widać jest w tym przypadku wybór wartości startowej,najczęściej jest za nią przyjmowana wartość początkowa szeregu Y1lub jest to średnia z pierwszych czterech lub pięciu obserwacjipoczątkowych. Takie proste wygładzanie wykładnicze używane jestw przypadku prognoz krótkoterminowych, gdy dane nie wykazujątrendu ani sezonowości.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 14: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Filtry wygładzające

W przypadku wystąpienia trendu używa się podwójnegowygładzania wykładniczego Holta postaci:

St = αYt + (1 − α)(St−1 + bt−1), 0 < α < 1bt = β(St − St−1) + (1 − β)bt−1, 0 < β < 1

orazYt+1 = St + bt

gdzie St jest wygładzoną wartością zmiennej prognozowanej wchwili t, a bt wygładzoną wartością przyrostu trendu w okresie t.Za wartości startowe przyjmuje się S1 = Y1 oraz b1 = Y2 − Y1 lubb1 = (Yn − Y1)/(n − 1). Jeśli dodatkowo uwzględnimy sezonowośćto dostaniemy potrójne wygładzanie wykładnicze, zwane równieżmetodą Wintersa (pojawia się tam dodatkowy parametr γ).Ogólnie wygładzenie wykładnicze jest nazywane filtremHolta-Wintersa.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 15: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Filtry wygładzające w R

Filtr liniowy realizuje funkcja filter, której pierwszym argumentemjest szereg czasowy, natomiast drugim argumentem jest wektorwag. Filtrowanie wykładnicze realizuje funkcja HoltWinters, którejpierwszym argumentem jest szereg czasowy, następne trzyparametry alpha, beta i gamma określają wartości odpowiednichparametrów modelu. Jeśli nie zostaną podane (ustalenie na NULLwyklucza parametr z modelu), funkcja poszuka wartościminimalizujących błąd średniokwadratowy predykcji.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 16: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Metoda analityczna

Najczęściej stosowana jest funkcja liniowa postaci:

Yt = α0 + α1 · t + εt,

gdzie εt oznacza składnik losowy. Na podstawie danych z szereguempirycznego wyznacza się oszacowanie tej funkcji:

Yt = a0 + a1 · t,

gdzie estymatory parametrów wyznaczamy według wzorów:

a1 =

12n∑

t=1Yt · t

n3 − n −6

n∑t=1

Yt

n2 − n ,

a0 = Y − a1 · t.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 17: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Autokorelacja

Aby powyższe wzory były poprawne, odchylenia resztowe muszą byćlosowe oraz nie może występować autokorelacja (ACF) (ang.autocorrelation) składnika losowego. Autokorelacja występuje wtedy, gdyskutki działania zmienności losowej nie wygasają w danym okresie t, leczsą przenoszone na okresy przyszłe t + 1 (autokorelacja rzędu pierwszego),t + 2 (autokorelacja rzędu drugiego) itd. Autokorelacja rzędu k(popularnie zwana opóźnieniem) jest funkcją, która argumentowinaturalnemu k przypisuje wartość współczynnika korelacji Pearsonapomiędzy szeregiem czasowym, a tym samym szeregiem cofniętym o kjednostek czasu. Formalnie (dla procesów stacjonarnych):

ρ(k) = γ(k)γ(0) ,

gdzie

γ(k) = cov(Yt,Yt+k) = E[(Yt − µ)(Yt+k − µ)]

jest autokowariancją rzędu k oraz µ = E(Yt).Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 18: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Autokorelacja

Najczęściej spotykaną formą autokorelacji jest autokorelacja dodatnia.Dodatnio skorelowane zaburzenia losowe nie zachowują się całkowiciechaotycznie. Jeśli w okresie t błąd losowy był dodatni, toprawdopodobieństwo, że w okresie t + 1 będzie on także dodatni, jestwyższe niż prawdopodobieństwo, że w okresie tym będzie on ujemny.Spowodowana jest ona zwykle rozciągnięciem na dłużej niż jeden okresskutków zdarzeń losowych wpływających na poziom zmiennej objaśnianej.Rzadziej spotykaną formą autokorelacji jest autokorelacja ujemna. Wtakim przypadku prawdopodobieństwo wystąpienia po dodatnim błędzielosowym ujemnego błędu jest wyższe niż prawdopodobieństwowystąpienia dodatniego błędu. Autokorelacja może być takżespowodowana przyjęciem błędnej postaci funkcyjnej dla estymowanegomodelu. Sprawdzenie istotności autokorelacji składnika losowegonastępuje najczęściej za pomocą testu Durbina-Watsona, w którymhipoteza zerowa zakłada brak autokorelacji.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 19: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Autokorelacja – wykresy

a) Brak autokorelacji b) autokorelacja dodatnia c) autokorelacjaujemna

a) Autokorelacja dodatnia b) autokorelacja ujemnaTomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 20: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Modelowanie szeregów czasowych z autokorelacją

Jeśli autokorelacja występuje szereg czasowy modeluje się poprzez:Proces średniej ruchomej (MA) rzędu q postaci:

Yt = c +q∑

j=0βjεt−j,

gdzie εt jest czynnikiem losowym (o wartości oczekiwanej 0oraz wariancji σ2), przy czym εi oraz εi+1 są niezależne dlakażdej wartości i.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 21: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Modelowanie szeregów czasowych z autokorelacją

Proces autoregresji (AR) rzędu p postaci:

Yt = α0 +p∑

i=1αiYt−i + εt.

W procesie AR(p) uwzględniamy wpływ p poprzednichwartości szeregu na jego wielkość w momencie t.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 22: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Modelowanie szeregów czasowych z autokorelacją

Proces autoregresji i średniej ruchomej (ARMA) rzędu (p, q)postaci:

Yt = α0 +p∑

i=1αiYt−i +

q∑j=0

βjεt−j,

w którym dodajemy dodatkowo efekt wpływu czynnikalosowego z poprzednich momentów czasowych na wartośćszeregu w momencie t.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 23: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Modelowanie szeregów czasowych z autokorelacją

Scałkowany proces autoregresji i średniej ruchomej (ARIMA)rzędu (p, d, q). Jeśli w danych występuje wyraźny trend(proces jest niestacjonarny), należy taki trend usunąć przeddalszą analizą. Trend usuwany jest poprzez różnicowanie drazy. Stopień różnicowania określony jest przez stopieńwielomianu opisującego trend (pojedyncze różnicowanie usuwatrend liniowy, podwójne kwadratowy itd.). Operacjaróżnicowania polega na d krotnym zastępowaniu szereguszeregiem różnic wyrazów sąsiednich. Przy każdej takiejoperacji długość szeregu zmniejsza się o jeden. Gdy metodąróżnicowania dojdziemy do szeregu stacjonarnego obliczającróżnice rzędu d, taki szereg nazywamy szeregiemzintegrowanym stopnia d.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 24: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Stacjonarność

Średnia szeregu czasowego (trend) nie powinna być funkcją czasu,raczej powinna być stała.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 25: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Stacjonarność

Wariancja szeregu czasowego nie powinna być funkcją czasu.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 26: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Stacjonarność

Kowariancja i-tego i (i + m)-ego składnika nie powinna byćfunkcją czasu.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 27: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Stacjonarność

Jeśli nie mamy pewności co do stacjonarności szeregu, możemyspróbować zbadać to jednym z dostępnych testów stacjonarności.Do najpopularniejszych należy test Dickeya-Fullera. Hipotezazerowa stanowi, że szereg jest niestacjonarny. Proces AR orazARMA są stacjonarne jeżeli wszystkie pierwiastki równaniacharakterystycznego są większe co do wartości bezwzględnej od 1.Jeżeli w modelu zawarto funkcję zależną od czasu t, to proces jestniestacjonarny. Proces MA jest zawsze stacjonarny.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 28: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Stacjonarność

Proces Yt =12Yt−1 + εt ma równanie charakterystyczne

postaci x − 2 = 0, które ma pierwiastek równy 2. Jest tozatem proces stacjonarny.Proces Yt = Yt−1 − 1

4Yt−2 + εt ma równaniecharakterystyczne postaci x2 − 4x + 4 = 0, które mapierwiastek podwójny równy 2. Zatem jest to również processtacjonarny.Proces Yt =

12Yt−1 +

12Yt−2 + εt ma równanie

charakterystyczne postaci x2 + x − 2 = 0, które ma pierwiastkirówne -2 i 1. Ponieważ nie są oba większe co do wartościbezwzględnej od 1, zatem proces jest niestacjonarny.Proces Yt = −1

4Yt−2 + εt ma równanie charakterystycznepostaci x2 + 4 = 0, które ma dwa pierwiastki zespolonepostaci ±2i, dla których |2i| =

√22 + 02 = 2. Czyli proces

jest stacjonarny.Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 29: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Flowchart

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 30: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Flowchart

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 31: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Inne modele

Istnieje oczywiście znacznie więcej metod modelowania szeregówczasowych (oczywiście można spróbować też każdej metodyregresyjnej), np.

ETS – bardziej wyrafinowane wygładzanie wykładnicze.BATS – modele o złożonej sezonowości.THETA – wygładzanie wykładnicze z dryftem.Prophet – metoda zaproponowana przez naukowców zFacebooka, mająca dawać dobre prognozy bez „ręcznego”dopasowywania parametrów. Uwzględnia trend, sezonowość,święta oraz punkty zmian.

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 32: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Inne modele

Bibliografia

Hyndman, R.J., Athanasopoulos, G. (2018). Forecasting: principles and practice,2nd edition, OTexts: Melbourne, Australia. OTexts.com/fpp2

Taylor, S.J., Letham, B. (2017). Forecasting at scale. PeerJ Preprints, Tech.Rep. e3190v2

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych

Page 33: Analizadynamikizjawiskmasowych Wprowadzeniedrizzt.home.amu.edu.pl/images/DADA_AIPD/W7.pdf · metodą Wintersa (pojawia się tam ... Istnieją dwa jego rodzaje w zależności czy przyjmujemy

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

...

.

Szeregi czasoweFiltry

Autokorelacja i modele ARIMA

Tomasz Górecki Analiza danych (W7) – Analiza szeregów czasowych