Upload
ivanar85
View
29
Download
2
Embed Size (px)
DESCRIPTION
stat metodd
Citation preview
STATISTIČKE METODE ZA POSLOVNO UPRAVLJANJE Josipa Rajić
METODE PROGNOZIRANJA
Za potrebe poslovnog upravljanja nužno je predviđanja procesa u poduzeću i njegovom
relevantnom okruženju. Za to se koriste različite metode prognoziranja.
Metode prognoziranja možemo podijeliti na:
- Statističke metode koriste podatke za prognoziranje pojava. Statistička metoda je
empirijska metoda, istraživanjem pojava u velikom broju njezinih pojavnih oblika
nastoji se doći do općeg zaključka o toj pojavi. Takvi zaključci se mogu donositi uz
određenu vjerojatnost i potrebno je provjeravati istinitost zaključaka (testiranje
hipoteza).
- Nestatističke metode se temelje na predviđanju kretanja pojava na osnovu analiza
financijskih i drugih podataka kojima se raspolaže, zatim na subjektivnim procjenama
na osnovama poznavanja tehnoloških promjena isl.
Statističke metode dalje dijelimo:
- Projekcijske
- Kauzalne
Projekcijske metode koriste analizu ponašanja pojave u prošlosti, i na osnovu utvrđenih
zakonitosti vrši se projekcija ponašanja pojave u budućnosti.
Modeli koji se rješavaju projekcijskim metodama imaju samo jednu varijablu. Nazivaju se još
i ekstrapolativne metode.
U ovu skupinu spadaju metode dekompozicije vremenske serije na komponente, metode
izglađivanja, ARIMA modeli.
Kauzalne metode vrše analizu efekata vanjskih utjecaja, a zatim se kreira model pomoću
kojeg se vrši prognoziranje. Kod ovih metoda imamo više varijabli, vrijednost pojave koja se
proučava prognozira se u zavisnosti od promjene drugih varijabli koje na nju utječu.Pojava
1
koja se proučava je zavisna varijabla, a pojave koje utječu na proučavanu varijablu su
nezavisne varijable. Zavisna varijabla je uvijek jedna pojava, a nezavisnih može biti jedna ili
više.U ovu skupinu metoda spadaju ekonometrijski modeli i regresijski modeli.
Podjela metoda prognoziranja s aspekta vremenskog perioda za koji se prognozira.
Prema ovom kriteriju imamo
- Dugoročne prognoze - prognoza na period od nekoliko godina unaprijed
- Srednjoročne prognoze – prognoze na period dvije do tri godine
- Kratkoročne prognoze – prognoze na period nekoliko tjedana, mjeseci do godinu
dana.
Primjena bilo koje statističke metode temelji se na raspoloživosti odgovarajućih podataka.
MODELI REGRESIJE
Razlikovanje determinističke i stohastične (ili statističke) zavisnosti pojava.
Određivanje smjera veze, jačine veze i oblika veze.
Opći oblik modela regresije je: Y= f (X , X , ... X ) + ε
Model se sastoji od determinističkog dijela, koji predstavlja matematičku funkciju kojom se
izražava zavisnost zavisne varijable od određenog broja nezavisnih varijabli, i stohastičnog
dijela koji predstavlja odstupanje od funkcionalne zavisnosti
Modele regresije možemo podijeliti s obzirom na broj nezavisnih varijabli uključenih u model
i s obzirom na oblik matematičke funkcije determinističkog dijela modela.
S obzirom na broj nezavisnih varijabli u modelu, modeli regresije se dijele na modele
jednostavne regresije i modele višestruke regresije.
Model jednostavne linearne regresije ima jednu zavisnu i jednu nezavisnu varijablu.
Model višestruke regresije ima jednu zavisnu i više nezavisnih varijabli.
2
Prema obliku matematičke funkcije determinističkog modela, modele regresije dijelimo na
linearne i nelinearne ili krivolinijske modele.
Veza među varijablama kod linearnog modela predočena je linearnom funkcijom, čiji je graf
pravac.
Veza između varijabli kod krivolinijske regresije ima oblik neke druge matematičke funkcije,
čiji je graf neka kriva linija.
Model jednostavne linearne regresije, opći oblik modela je:
U modelu jednostavne linearne regresije vrijednost zavisne varijable Y je linearna
kombinacija vrijednosti nezavisne varijable X, parametara modela i slučajne varijable.
Funkcionalni dio modela određen je ako su poznate vrijednosti parametara
Vrijednost parametara se procjenjuje na temelju uzorka ili izmjerenih n parova vrijednosti
varijable x i y.
Model sa procijenjenim parametrima je:
Vrijednost procijenjenih parametara se izračunava iz n izmjerenih parova vrijednosti x i y.
Regresijske vrijednosti se dobivaju uvrštavanjem odgovarajućih vrijednosti nezavisne
varijable x u model regresije.
Rezidualna odstupanja su odstupanja izmjerenih vrijednosti zavisne varijable od regresijskih
vrijednosti.
Model regresije je reprezentativniji što su manja rezidualna odstupanja.
Kakvoća modela se mjeri odgovarajućim pokazateljima, a najznačajniji su:
Varijanca ili prosječno kvadratno odstupanje, dobiva se tako da se zbroj kvadrata
rezidualnih odstupanja podijeli brojem podataka.
Standardna greška modela ili prosječno odstupanje podataka od regresijskih
vrijednosti, dobiva se kao pozitivni drugi korijen iz varijance.
3
y i=b0+b1 x i+e i
Koeficijent varijacije je omjer standardne devijacije i prosječne vrijednosti zavisne
varijable, pomnoženo sa 100.
U analizi reprezentativnosti regresijskog pravca koristi se koeficijent determinacije.
Koeficijent determinacije je relativna mjera prilagođenosti regresijskog pravca empirijskim
podacima.
Dobiva se kao omjer protumačenog dijela zbroja kvadrata odstupanja i ukupnog zbroja
kvadrata odstupanja.
Ukupno odstupanje empirijskih podataka (varijabla y) od prosječne vrijednosti varijable y se
rastavlja na dio odstupanja protumačen modelom regresije (razlika regresijske vrijednosti i
prosječne vrijednosti) i dio ne protumačen modelom (razlika izmjeđu izmjerene i regresijske
vrijednosti).
Koeficijent determinacije uzima vrijednosti iz intervala 0 i 1.
TESTIRANJE ZNAČAJNOSTI PARAMETARA MODELA REGRESIJE
Parametri općeg modela se procjenjuju na temelju izračunate vrijednosti odgovarajućeg
parametra koristeći n izmjerenih parova vrijednosti x i y. Izmjerene vrijednosti čine uzorak, a
statističkim zaključivanjem se nastoji doći do općih zaključaka (za osnovni skup).
Zbog toga je potrebno postupkom testiranja statističke hipoteze provjeriti jesu li vrijednosti
parametara statistički značajni.
U modelu jednostavne linearne regresije u stvari je bitna vrijednost parametra uz nezavisnu
varijablu, jer on pokazuje promjenu zavisne varijable za jedinično povećanje nezavisne
varijable. Vrijednost slobodnog člana modela ima uglavnom matematičko, a ne stvarno
značenje za zavisnost analiziranih pojava.
Regresijski koeficijent ili parametar uz nezavisnu varijablu je značajan ako je različit od nule,
jer povećanjem vrijednosti nezavisne varijable povećava se (reg.koeficijent veći od 0) ili se
smanjuje (reg.koeficijent manji od 0) vrijednost zavisne varijable. Ako je regresijski
4
koeficijent jednak 0 onda promjena nezavisne varijable ne utječe na vrijednost zavisne
varijable.
Za testiranje značajnosti regresijskog koeficijenta može se koristiti tzv. t-test ili F-test
T-test
Postupak testiranja polazi od postavke hipoteza, nulte i alternativne, koje u ovom slučaju
imaju sljedeći oblik:
H : β≠ 0
Test statistika je empirijski t- omjer:
Test statistika je distribuirana po studentovoj distribuciji s (n-2) stupnja slobode.
Odluka se donosi usporedbom empirijske vrijednosti s kritičnom vrijednosti t distribucije za
danu razinu signifikantnosti (1- ∝) i broj stupnjeva slobode. Nulta hipoteza se prihvaća ako
je
a ako je
odbacuje se nulta i prihvaća alternativna hipoteza.
F- test ili analiza varijance (ANOVA)
Analiza varijance je metoda matematičke statistike koja se temelji na raščlanjivanju ukupnog
zbroja kvadrata odstupanja (SST) izmjerenih vrijednosti zavisne varijable od njezine
aritmetičke sredine na komponente koje opisuju određene izvore varijacija, a to su zbroj
protumačenih kvadrata odstupanja (SSP) i zbroj neprotumačenih (rezidualnih) kvadrata
odstupanja (SSR)
Rezultati izračuna se upisuju u tablicu tzv. tablicu ANOVA.
Postupak testiranja
Izračuna se vrijednost empirijskog F0 – omjera
5
H0 : β1=0
t0=b1
σ ( β1 )
|t0|≤t (α /2; n−2 )
|t0|>t (α /2 ;n−2 )
∑i=1
n
( y i− yi )2=∑i=1
n
( y i− yi )2+∑i=1
n
( yi− y i )2
F0 - omjerima F- oblik distribucije, što znači da se uspoređuje izračunata vrijednost sa
tabličnom vrijednosti F – distribucije, za izabranu razinu signifikantnosti testa ( 1 – α ) i za
odgovarajući broj stupnjeva slobode veličine u brojniku i veličine u nazivniku
Ako je izračunata vrijednost F0 -omjera manja od odgovarajuće tablične vrijednosti, to znači
da se razlika između protumačene i rezidualne procjene varijance mogu pripisati slučaju i da
treba prihvatiti nultu hipotezu (regresijski koeficijent nije značajan), u protivnom se odbacuje
nulta i prihvaća alternativna hipoteza da je regresijski koeficijent značajan .
INTERVALNA PROCJENA PARAMETARA MODELA REGRESIJE
Parametri modelaβ i β se procjenjuju intervalno i to pomoću parametara bi b koji su izračunati
pomoću podataka iz uzorka.
- Parametri b i b izračunati za različite uzorke predstavljaju slučajne varijable, koje imaju
normalan oblik distribucije (za uzorke preko 30 statističkih jedinica ili T oblik distribucije za
manje uzorke).
Očekivana vrijednost sampling-distribucije parametra b jednaka je parametru β općeg
modela (E(b ) = β ¿ , a standardna devijacija se označava i naziva se standardna greška
procjene parametraβ .
Intervalna procjena slobodnog člana modelaβ uz pouzdanost ( 1 – α ) dobiva se pomoću
izraza:
b - je slobodni član model procijenjen pomoću n izmjerenih parova vrijednosti varijabli X i Y-
(x , y )
σ ¿ ) - je standardna greška procjene parametra β a izračunava se pomoću izraza
U navedenom izrazu veličina je procijenjena varijanca općeg modela (osnovnog skupa), a
procjena se vrši na osnovu varijance procijenjenog modela (uzorka).
Veličina je kritična vrijednost t distribucije za vrijednost funkcije i (n-2) stupnja slobode.
6
Očekivana vrijednost sampling distribucije parametra jednaka je parametru općeg modela,
a standardna devijacija se naziva standardna greška procjene parametra .
Intervalna procjena regresijskog koeficijenta općeg modela uz pouzdanost dobiva
se pomoću izraza:
Standardna pogreška procjene parametraβse izračunava pomoću izraza:
Intervalna procjena vrijednosti zavisne varijable za poznatu vrijednost nezavisne varijable
Procjena vrijednosti zavisne varijable za zadanu vrijednost nezavisne varijable može biti
procjena brojem i intervalom.
Neka je zadana vrijednost nezavisne varijable x procijenjena vrijednost se dobiva pomoću
izraza
Intervalna procjena vrijednosti zavisne varijable za zadanu vrijednost nezavisne varijable ,
uz pouzdanost x ima oblik:
Standardna greška za intervalnu procjenu prosječne vrijednosti zavisne varijable za zadanu
vrijednost nezavisne varijable ima oblik
Standardna greška za procjenu intervala individualnih vrijednosti zavisne varijable za zadanu
vrijednost nezavisne varijable je
NELINEARNI REGRESIJSKI MODEL
Kod svih modela regresije radi se o statističkoj međuzavisnosti pojava, pa modeli imaju
funkcionalni dio i slučajnu promjenjivu.
7
σ ( β1 )=√ σ2
∑i=1
n
x i2−n x2
P (b1−t (α /2 ; n−2)⋅σ (β1)<β1<b1+t(α /2; n−2)⋅σ ( β1))=(1−α )
y0=b0+b1 x0
P ( y0−t (α /2; n−2 )⋅σ ( y0 )<Y 0< y0−t (α /2 ; n−2 )⋅σ ( y0) )=(1−α )
σ ( y0)=σ √ 1n+
(x0− x )2
∑i=1
n
x i2−n x2
σ ( y0)=σ √1+1n+
(x0− x )2
∑i=1
n
x i2−n x2
Analiza funkcionalnog dijela zavisi od oblika funkcije koji se koristi, a analiza rezidualnih
odstupanja se provodi na isti način bez obzira na oblik funkcije. Zbog toga je kod krivolinijskih
modela navedena analiza samo funkcionalnog dijela.
Analiza rezidualnih odstupanja provodi se izračunavanjem istih pokazatelja
reprezentativnosti kao kod linearnog modela.
Funkcionalni dio eksponencijalni model ima oblik:
Logaritmiranjem izraza dobiva se linearizirani model:
Analiza transformiranog modela provodi se na isti način kao kod linearnih modela, uz
napomenu da je kod interpretacije rezultata nužno voditi računa koje su varijable ili
parametri transformirani.
U navedenom modelu izvršena je transformacija zavisne varijable i koriste se logaritamske
vrijednosti varijable .
Vrijednosti parametara koji se procjenjuju pomoću empirijskih vrijednosti se dobivaju u
logaritamskim vrijednostima.
Model s procijenjenim parametrima, koji se izračunavaju na osnovu izmjerenih n parova
vrijednosti varijabli X i Y, , u originalnom i transformiranom obliku glasi:
Vrijednost parametara, odnosno njihovih logaritamskih vrijednosti se dobiva pomoću izraza:
Vrijednost parametara originalnog modela dobiva se antilogaritmiranjem.
Parametar predstavlja vrijednost zavisne varijable kada nezavisna varijabla ima
vrijednost nula. Kao i kod linearnog modela uglavnom nema stvarno značenje.
Vrijednost parametra pokazuje relativnu promjenu zavisne varijable za jedinično relativno
povećanje nezavisne varijable. Tumači se uglavnom kao postotna promjena. Znači, ako se
nezavisna varijabla poveća za 1% zavisna varijabla će se promijeniti u postotcima za iznos
pomnožen sa sto.
8
y i=β0 β1
xi
log { y i=log β0+ log β1⋅xi¿
( log yi )
y i=b0 b1
xi log { y i=log b0+log b1⋅x i¿
(x i , y i )
log b1=∑i=1
n
x i⋅log yi−n⋅x⋅log y
∑i=1
n
x i2−n⋅x2
log b0=log y−logb1⋅x
b0
b1
b1
Logaritamski model koristi transformaciju nezavisne varijable ( ), a opći oblik regresije je:
Model s procijenjenim parametrima koji se dobiju pomoću izmjerenih n parova vrijednosti
zavisne i nezavisne varijable, ima oblik:
Vrijednosti parametara procijenjenog modela se izračunavaju pomoću izraza:
Parametar predstavlja vrijednost zavisne varijable kada je nezavisna varijabla jednaka
jedan .
Parametar pokazuje prosječno linearno povećanje zavisne varijable kada se logaritam
nezavisne varijable poveća za jedan (vrijednost logaritma 0, 1, 2, 3, 4,… imaju redom brojevi
1, 10, 100, 1000, 10000,…)
Recipročni model regresije ima oblik:
Korištenjem recipročne vrijednosti za zavisnu varijablu , model se transformira u
linearni oblik:
MODEL POLINOMSKE REGRESIJE
U izboru tipa krivulje koja je najbolje prilagođena točkama u dijagramu rasipanja može se
poći od modela polinomske regresije. Opći oblik polinomske regresije je:
Koeficijenti polinoma , su parametri modela regresije koje treba procijeniti. Procjena
parametara vrši se pomoću izmjerenih n parova vrijednosti zavisne i nezavisne varijable , a
model s procijenjenim parametrima ima oblik:
U modelu polinomske regresije vrijednost zavisne varijable je kombinacija nepoznatih
parametara , numeričkih vrijednosti nezavisne varijable s različitim
stupnjevima i nepoznatih vrijednosti slučajne varijable.
9
y i=β0+β1 log x i
log x i
y i=b0+b1 log x i(x i , y i )
b1=∑i=1
n
log x i⋅y i−n⋅log x⋅y
∑i=1
n
( log x i )2−n⋅(log x )2
b0= y−b1⋅log x
( log 1=0 )b0
y i=1
β0+ β1 x i
b1
( 1y i )
1y i
=β0+β1 x i
y i=β0+β1 xi+β2 xi2+.. . .+ β j x i
j+ .. ..+βk xik
y i
β j
y i=b0+b1 x i+b2 x i2+.. . .+b j x i
j+. . ..+bk x ik
(x i , y i )
( j=1,2 ,. .. , k )β j
Ovdje je prikazan samo funkcionalni dio modela, a analiza slučajne varijable ili rezidualnih
odstupanja se provodi na isti način kao kod modela jednostavne linearne regresije.
Procjena parametara se provodi metodom minimalnih kvadrata odstupanja, slično kao kod
modela jednostavne linearne regresije, samo je broj normalnih jednadžbi jednak broju
nepoznatih parametara.
U zavisnosti od vrijednosti k imamo polinome različitog stupnja. Za k=1 imamo polinom
prvog stupnja ili linearnu funkciju; za k = 2 polinom je drugog stupnja ili kvadratna funkcija
čiji graf je parabola; za k =3 polinom je trećeg stupnja…
Teorijski k može uzeti bilo koju vrijednost iz skupa prirodnih brojeva, ali se u praksi koriste
uglavnom polinomi drugog i trećeg stupnja.
Porastom stupnja polinoma, procjena parametara modela polinomske regresije postaje
matematički znatno složenija, a javlja se i problem tumačenja izračunatih parametara.
Za model kvadratne regresije procijenjeni model ima oblik:
Graf kvadratne funkcije je parabola, a procjena regresijskih koeficijenata , i se
dobiva rješavanjem sustava normalnih jednadžbi:
VIŠESTRUKA LINEARNA REGRESIJA
Opći oblik modela višestruke linearne regresije je:
Model ima jednu zavisnu varijablu i m nezavisnih varijabli.
Parametri modela su ,
10
y i=b0+b1 x i+b2 x i2
b0
b0n +b1∑i=1
n
xi+b2∑i=1
n
x i2=∑
i=1
n
y i
b0∑i=1
n
x i+b1∑i=1
n
x i2+b2∑
i=1
n
x i3=∑
i=1
n
x i y i
b0∑i=1
n
x i2+b1∑
i=1
n
xi3+b2∑
i=1
n
xi4=∑
i=1
n
x i2 y i
Y=β0+β1 X1+β2X 2+. .. .+β j X j+. . ..+βm Xm+E
( j=1,2 ,. .. , k )β j
Slobodni član modela (matematičko značenje) pokazuje vrijednost zavisne varijable kada su
vrijednosti svih m - nezavisnih varijabli jednake nula, uglavnom u modelu nema značenje.
Parametri uz nezavisne varijable – pokazuju za koliko se u prosjeku promijeni vrijednost
zavisne varijable kada se nezavisna varijabla (čiji parametar tumačimo) poveća za jedinicu
pod uvjetom da vrijednosti ostalih varijabli ostanu nepromijenjene.
PROJEKCIJSKE METODE PROGNOZIRANJA ILI PROGNOZIRANJE PUTEM VREMENSKIH SERIJA
Statističke pojave se mijenjaju tijekom vremena. Dinamika promjena pojava se prati pomoću
vremenskog niza.
Vremenski niz ili vremenska serija je skup kronološki uređenih podataka kojima se prate
promjene neke statističke pojave.
Podaci koji tvore niz nazivaju se članovi niza, frekvencije ili razina pojave. Označavaju se:
gdje je - frekvencije vremenskog niza, a t – brojač vremenskih intervala ili vremenskih
točaka na koje se odnose podaci.
Broj članova niza n označava duljinu niza.
Podaci u vremenskom nizu se uvijek odnose na prošle vremenske periode.
Smisao analize vremenskog niza jeste otkrivanje zakonitosti u razvoju pojave koja se
modelira kako bi se te zakonitosti mogle projicirati na budućnost i izvršiti prognoza pojave za
naredno, duže ili kraće razdoblje.
Klasifikacija vremenskih nizova moguća je prema različitim kriterijima, a najčešće su korišteni
svojstvo kumulativnosti i način formiranja frekvencija vremenskog niza.
Prema svojstvu kumulativnosti vremenski nizovi se dijele na intervalne i trenutačne.
Intervalni vremenski niz prikazuje kretanje pojave u sukcesivnim vremenskim intervalima i
ima svojstvo kumulativnosti.
11
y1 , y2 , .. . , y t , .. . , yny t
Frekvencije mu nastaju zbrajanjem vrijednosti pojave po kraćim intervalima. Da bi
frekvencije bile usporedive, nužno je da intervali budu jednaki.
Podaci u intervalnom vremenskom nizu se mogu zbrajati i zbroj ima značenje.
Trenutačni vremenski niz predstavlja kronološki uređene podatke o stanju pojave u točno
određenim vremenskim točkama.
Frekvencije trenutačnog niza po pravilu predočuju stanje pojave u precizno izabranim i
jednako udaljenim vremenskim točkama. Ako se ne raspolaže frekvencijama po svim jednako
udaljenim točkama vremenskog razdoblja u kojemu se prati neka pojava frekvencije niza su i
tada usporedive.
Trenutačni vremenski niz nema svojstvo kumulativnosti pa se frekvencije ne zbrajaju jer
zbroj nema konkretno značenje.
Prema načinu formiranja frekvencija nizovi mogu biti izvorni i izvedeni.
Frekvencije izvornog niza nastaju neposrednim mjerenjem pojave u odabranim intervalima
vremena ili u odabranim vremenskim točkama.
Frekvencije izvedenog vremenskog niza nastaju računskim operacijama nad frekvencijama
jednog ili više vremenskih nizova. Računskim operacijama nad frekvencijama jednog
vremenskog niza mogu se izračunati promjene pojave po vremenskim periodima niza u
apsolutnim i relativnim iznosima, indeksni brojevi i slično. Izračunavanjem omjera frekvencija
dvaju nizova, dobivaju se različiti koeficijenti koji se mogu koristiti u analizi pojava.
Prije korištenja i analize vremenskog niza nužno je provjeriti je li usporedivost frekvencija
narušena. Ako su frekvencije usporedive kaže se da je vremenski niz konzistentan.
Usporedivost frekvencija može biti narušena: promjenom definicije pojave tijekom vremena
promatranja, prostornom promjenom administrativne jedinice za koju je vezana pojava i
različitim vremenskim intervalima definirane vremenske jedinice.
Analizu vremenskih serija obuhvaća:
definicija cilja analize;
12
analiza promatrane pojave u stvarnim uvjetima funkcioniranja;
prikupljanje i klasifikacija numeričkih podataka;
analiza konzistentnosti prikupljenih podataka;
izrada preliminarnog modela podataka;
kreiranje matematičkog modela za dinamičko promatranje pojave;
izrada programa za računalsku obradu ili odabir programskog paketa za obradu
podataka;
računalska obrada podataka;
analiza rezultata obrade;
analiza kakvoće matematičkog modela;
prognoziranje dinamičkog ponašanja promatrane pojave pomoću matematičkog
modela;
implementacija modela vremenske serije u praksi.
U analizi vremenskih serija koriste se različiti modeli i metode. Izbor odgovarajućih metoda i
modela zavisi od postavljenog cilja analize i karakteristika pojave koja je predočena
vremenskom serijom.
Prvi korak u analizi je grafički prikaz pomoću dijagrama rasipanja (scatter diagram). Dijagram
rasipanja daje jasnu sliku o kretanju pojave i ukazuje na mogući tip matematičkog modela
koji bi mogao reprezentirati raspoložive podatke vremenske serije.
Dinamičkom analizom vremenske serije može se utvrditi postojanje komponenti, i to trend, ciklične i
sezonske komponente. Ove komponente se nazivaju sistemske, rezultat su postojanja određenih
zakonitosti u razvoju pojave i mogu se modelirati.
Svaki vremenski niz ima slučajnu komponentu, jer se radi o statističkim podacima čija
vrijednost nije određena determinističkim procesima.
13
Trend komponenta pokazuje dugoročnu tendenciju u razvoju pojave. Većina vremenskih
nizova ima podatke koji izražavaju zakonitost u povećanju ili smanjenju pojave, bilo da se
radi o ravnomjernim promjenama u apsolutnim ili relativnim iznosima.
Cikličnu komponentu ima vremenski niz koji prikazuje pojavu koja se ponavlja na približno
jednak način u intervalima vremena dužim od godinu dana. Postojanje ciklične komponente
prema određenom modelu nije nužno kod svake vremenske serije.
Sezonsku komponentu ima vremenska serija podataka o pojavi koja se ponavlja na približno
isti način tijekom jedne godine. Da bi se analizirala ova komponenta, podaci se moraju
odnositi na mjesečne ili kvartalne vrijednosti frekvencija.
Vremenske serije u kojima individualne numeričke vrijednosti osciliraju oko neke konstantne
vrijednosti u određenom vremenskom periodu, nazivaju se konstantne serije.
Konstantne serije nemaju sistemske komponente, samo imaju slučajnu komponentu ili
slučajna odstupanja.
Statistička stacionarnost predstavlja karakteristiku vremenske serije za koju su njezine
osnovne statistike (srednja vrijednost, varijanca, autokorelacija itd.) konstantne tijekom
vremena.
Većina statističkih metoda se temelji na pretpostavci o približnoj stacionarnosti vremenskih
serija, odnosno na pretpostavci da se promatrana vremenska serija može stacionalizirati
primjenom matematičkih transformacija.
BROJČANA ANALIZA VREMENSKIH SERIJA
Pokazatelji dinamike su brojčane veličine kojima se izražavaju promjene u dinamici
vremenske serije.
Promjene frekvencija vremenske serije se mogu pratiti u odnosu na prethodno razdoblje ili
kao promjene prema frekvenciji odabranog baznog razdoblja.
Pokazatelji kojima se prati promjena razine pojave u uzastopnim razdobljima su: prve
diferencije, diferencije drugog ili višeg reda, koeficijent dinamike i stope promjene.
14
Navedeni pokazatelji se mogu odrediti kao pojedinačni, određuju se za sve članove niza
(osim prvog) i opisuju promjenu pojave u tekućem razdoblju u odnosu na prethodno
razdoblje.
Za pojedinačne pokazatelje može se odrediti prosječna vrijednost koja opisuje prosječnu
promjenu pojave u navedenom razdoblju.
Prve diferencije su pojedinačne mjere promjene pojave u uzastopnim razdobljima, izražene
u apsolutnim iznosima i mjernim jedinicama pojave.
Ako su vrijednosti vremenske serije, prve se diferencije dobiju kao
Prvih diferencija ima (n-1), jer se ne može odrediti za prvo razdoblje.
Prosječna prva diferencija se izračunava kao aritmetička sredina pojedinačnih promjena.
Definira se izrazom:
Diferencije drugog reda su mjere promjene prvih diferencija u uzastopnim razdobljima.
Dobivaju se pomoću izraza: t = 3,4,…, n
Analogno se izračunavaju diferencije trećeg reda kao razlika diferencija drugog reda itd.
Diferencije drugog i višeg reda su neprikladne za objašnjenje dinamike pojave i uglavnom
služe za izbor odgovarajućeg modela trenda.
Koeficijent dinamike je relativni broj kojim se opisuju promjene pojave u uzastopnim
razdobljima u relativnom iznosu.
Dobiva se kao omjer frekvencija tekućeg i prethodnog razdoblja t= 2, 3,…n
Može se odrediti za sve članove niza (osim prvog), pa predstavlja pojedinačnu mjeru.
Prosječna vrijednost koeficijenata dinamike se računa kao geometrijska sredina pojedinačnih
pokazatelja.
Kao relativni pokazatelji promjena pojave u vremenu, koeficijenti dinamike su pogodni
zauspoređivanje dinamike promjena raznorodnih pojava.
15
t=2,3 , .. . , nΔy t= y t− y t−1y1 , y2 , .. . , y t , .. . , yn
Δy=yn− y1
n−1Δy=
( y2− y1)+( y3− y2)+. . .+ ( yn− yn−1)n−1
Δ(2) y t=Δyt−Δyt−1
ν t=y t
y t−1
Stope promjene predstavljaju postotnu promjenu pojave u uzastopnim razdobljima.
Pojedinačne stope promjene definiraju se izrazom t = 2,3,..n
Stope promjene se mogu računati pomoću koeficijenta dinamike. Ako se razvije prethodni
izraz, dobiva se:
Označi li se u prethodnom izrazu koeficijent dinamike sa , dobiva se relacija za stope
promjene preko koeficijenta dinamike:
Ovaj izraz ima posebnu važnost za računanje prosječne stope promjene
Prosječna stopa promjene se računa kao geometrijska sredina pojedinačnih stopa. S
obzirom da stope mogu biti jednake nuli ili negativni brojevi, što stvara problem kod
računanja, koristi se geometrijska sredina koeficijenata dinamike
Dinamika neke pojave se može pratiti pomoću pokazatelja o odnosu frekvencija vremenske
serije prema frekvenciji odabranog baznog razdoblja. Promjene frekvencija mogu se pratiti
u apsolutnim i relativnim iznosima. Apsolutne mjere mogu biti prve, druge ili diferencije
višeg reda, a relativna mjera je stopa promjene u odnosu na bazno razdoblje.
Indeksi vremenskog niza su relativni brojevi koji pokazuju odnose stanja pojave u različitim
vremenskim razdobljima ili vremenskim točkama.
Dobivaju se kao omjer frekvencija tekućeg i baznog razdoblja. Prema složenosti pojave koju
prate, indeksi mogu biti individualni i skupni.
Mogu biti bazni i verižni. Bazni indeksi jednog vremenskog niza imaju istu izabranu bazu, a
verižni indeksi imaju za bazu razinu pojave u prethodnom razdoblju.
Verižni indeksi su relativni brojevi koji pokazuju koliko jedinica pojave u tekućem razdoblju
dolazi na svakih 100 jedinica pojave u prethodnom razdoblju. Izraz za računanje verižnih
indeksa je:
16
st=Δy ty t−1
⋅100=y t− y t−1
y t−1
⋅100
st=y t− y t−1
y t−1
⋅100=( y ty t−1
−y t−1
y t−1)⋅100=( y t
y t−1
−1)⋅100
st=(ν t−1 )⋅100
G=n−1√ yn
y1G=n−1√ν2⋅ν3⋅. ..⋅ν t⋅.. .⋅νn=n−1√ y2
y1
⋅y3
y2
⋅.. ..⋅yn−1
yn−2
⋅ynyn−1
s= (G−1 )⋅100
t=2,3 .. . . ,nV t=y ty t−1
⋅100
Bazni indeksi su relativni brojevi kojima se prate varijacije vremenske serije u odnosu na
odabrani (bazni) vremenski interval ili vremensku točku. Izraz za izračunavanje baznih
indeksa je:
MODELIRANJE VREMENSKIH SERIJA
Modeliranje vremenskih serija predstavlja proces iznalaženja mogućih relacija (formula) koje
opisuju kretanje određene pojave u vremenu.
S obzirom da pojave koje se prate statistički imaju stohastični karakter, kažemo da se radi o
slučajnoj varijabli.
Slučajna varijabla se modelira statističkim modelima, koji pored determinističkog dijela
(matematičke formule) imaju i slučajnu, neregularnu varijablu.
Iznalaženjem odgovarajućeg modela vremenske serije mogu se utvrditi zakonitosti u razvoju
neke pojave.
Projiciranjem utvrđenih zakonitosti na buduće kretanje pojave vrši se prognoziranje.
MODEL JEDNOSTAVNIH PROSJEKA
Najjednostavniji model vremenske serije je model jednostavnih prosjeka.
Deterministički dio modela vremenske serije je prosječna vrijednost izmjerenih vrijednosti.
Model ima oblik
Reprezentativnost modela se mjeri varijancom, standardnom devijacijom i koeficijentom
varijacije
Ovaj model je opravdano koristiti ako frekvencije vremenske serije osciliraju oko neke
konstante, odnosno ako pokazatelji reprezentativnosti modela upućuju da je greška modela
prihvatljiva.
17
t=1,2 ,. . ., nI t=y tyb
+100
y=1n∑t=1
n
yty=μ= yy t=μ+εt
V y=σ y
y⋅100σ y
2=1n∑i=1
n
( y i− y i )2
F t+1=F t+2=F t+3= .. ..=μ
Prognoze pojave za sve vremenske periode je ista vrijednost.
Model jednostavnih prosjeka je jednostavan za korištenje, ali su pojave koje se tijekom
vremena ne mijenjaju veoma rijetke, naročito ako se radi o duljem vremenskom periodu.
Osnovni nedostatak metode jednostavnih prosjeka je bio da daje istu važnost starijim kao i
novijim podacima.
Ovaj nedostatak se može otkloniti modeliranjem vremenske serije pomoću pokretnih
prosjeka.
Jednostavni pomični prosjeci su aritmetičke sredine - m uzastopnih vrijednosti vremenske
serije.
Na taj način originalna serija se zamjenjuje pomičnim prosjecima, a prognoza pojave se
provodi pomoću serije pomičnih prosjeka.
Pomični prosjeci smanjuju kolebanja u vremenskoj seriji, smanjuje se utjecaj sezonskih i
neregularnih komponenti, dok se utjecaj trend i ciklične komponente jasnije manifestira.
Model ima oblik
! U modelu m označava red pomičnih prosjeka ili broj individualnih vrijednosti vremenska
serije uključenih u prosjek. Tako, ako imamo prosjeke trećeg reda, pomični prosjek se
određuje za četvrti vremenski period kao prosjek tri prva podatka, za peti i naredne periode
do kraja vremenske serije uzima se prosjek frekvencija tri perioda koja neposredno prethode
tom periodu.
Mogu se koristiti prosjeci drugog, trećeg ili višeg reda.
U jednostavnim prosjecima svaka od m vrijednosti uključenih u izračunavanje ima isto
značenje ili ponder.
Pored metode jednostavnih pomičnih prosjeka koristi se i metoda ponderiranih (vaganih)
prosjeka.
18
t=m ,m+1 , .. . , nF t+1=1m
∑i=t−m+1
t
y i
Kod ove metode svakoj od m vrijednosti uključenih u izračunavanje prosjeka dodjeljuje se
različit ponder. Zbroj pondera treba biti jednak jedan.
Metoda pomičnih prosjeka se često koristi u praksi.
Broj frekvencija koje se uključuju u izračunavanje pomičnih prosjeka je konstantan i utvrđuje
se na temelju iskustva.
Reprezentativnost modela provodi se izračunavanjem prosječne greške, prosječnog
apsolutnog odstupanja i zbroja kvadrata grešaka.
MODEL EKSPONENCIJALNOG IZGLAĐIVANJA
Najčešće korištena metoda izglađivanja vremenske serije je metoda eksponencijalnog
izglađivanja.
Prognozirane vrijednosti u stvari predstavljaju vrijednost ponderiranog prosjeka svih
frekvencija u nizu starijih od perioda prognoze. Ponderi se dodjeljuju prema pravilima koje
određuje eksponencijalna funkcija.
Znači vrijednost pondera je najveća za podatak koji neposredno prethodi prognoziranoj
vrijednosti, a za starije podatke eksponencijalno opada što su podaci udaljeniji od vremena
prognoze.
Model eksponencijalnog izglađivanja se može napisati kao:
Vrijednosti dobivene metodom eksponencijalnog izglađivanja u stvari predstavljaju
ponderirani prosjek prethodne frekvencije u nizu i prognoze za taj period.
Kod modela eksponencijalnog izglađivanja potrebno je odrediti ponder za najnoviju
vrijednost vremenske serije kao i početnu prognostičku vrijednost.
Za vrijednost obično se uzimaju vrijednosti iz intervala od 0,1 do 0,2.
Za početnu procjenu se može uzeti prva vrijednost u seriji, aritmetička sredina prvih šest ili
aritmetička sredina svih frekvencija u nizu
19
t=m ,m+1 , .. . , nF t+1=1m
∑i=t−m+1
t
y iwi
y=ax
F t+1=αyt+(1−α ) Ft
Optimalna vrijednost konstante izglađivanja se određuje minimizacijom rezidualne greške.
Za mjerenje rezidualne greške se koriste standardni pokazatelji kao što su standardna
devijacija, prosječno apsolutno odstupanje, koeficijent varijacije i dr.
U praksi se često koristi drugi korijen iz srednje kvadratne rezidualne greške, koja uzima u
obzir i prosječnu vrijednost rezidualne greške kao i standardnu devijaciju rezidualne greške.
MODELI TRENDA
Model trenda predstavlja analitički izraz kojim se opisuje dugoročna tendencija u razvoju
istraživane pojave.
Opći oblik modela trenda je , gdje je Y pojava predočena vremenskom serijom,
nepoznata funkcija vremena, a e nepoznata slučajna odstupanja od trenda s obilježjima
slučajne varijable.
Za izbor oblika funkcije koristi se dijagram rasipanja.
Pokazatelji dinamike također mogu poslužiti za izbor oblika funkcije u modelu trenda
Ako su prve diferencije približno jednake, linearna funkcija najbolje aproksimira
empirijske podatke vremenskog niza.
Za vremensku seriju s približno istim vrijednostima drugih diferencija, preporuča se
korištenje paraboličnog trenda.
Ako vremenska serija ima približno jednake stope promjene, najbolje je koristiti
eksponencijalni trend.
Za linearni model trenda opći oblik je:
Analizira li se model sa stajališta deskriptivne statistike, procijenjeni model određen na
temelju ograničenog broja podataka ima oblik:
20
Se=√ 1n−1
∑t=1
n
(e t−e )2e=1n∑t=1
n
etRMPSE=√ e2+se2
Y=f (t )+e
f ( t )
Y=β0+β1 xt+εt
y t=b0+b1 x t+et
Parametar je slobodni član modela i predstavlja vrijednost pojave u nultom razdoblju,
odnosno u razdoblju koje prethodi prvom razdoblju za koji je mjerena vrijednost pojave.
Parametar je koeficijent trenda koji pokazuje prosječnu promjenu pojave iz razdoblja u
razdoblje.
Parametri modela se izračunavaju pomoću formula
Pojedinačne vrijednosti trenda se dobivaju uvrštavanjem vrijednosti varijable vrijeme u
deterministički dio modela i nazivaju se trend vrijednosti.
Deskriptivno-statistička analiza reprezentativnosti modela trenda polazi od odstupanja
izmjerenih vrijednosti pojave i trend vrijednosti .
Ovo su pojedinačna rezidualna odstupanja, a prosječno odstupanje se računa preko kvadrata
odstupanja.
Prvo se računa prosječno kvadratno odstupanje ili varijanca. Izraz za varijancu je:
Pozitivni drugi korijen iz varijance je standardna devijacija ili standardna greška modela
trenda.
Prosječna relativna mjera se dobiva stavljanjem u odnos standardne greške modela trenda i
prosječne vrijednosti pojave koja se modelira. Dobivena mjera se naziva koeficijent varijacije.
Za mjerenje reprezentativnosti modela trenda koristi se koeficijent determinacije.
Ako su druge diferencije vremenske serije približno jednake, može se koristiti polinom
drugog stupnja ili kvadratna funkcija za model trenda.
Graf kvadratne funkcije je parabola pa se ovaj model naziva parabolični trend.
Opći oblik paraboličnog modela trenda je:
Model s procijenjenim parametrima dobijem iz n- izmjeren vrijednost vremenske serije je:
21
b1
b0
b0= y−b1 xb1=∑t=1
n
x t y t−n x⋅y
∑t=1
n
x t2−n x2
y t=b0+b1 x t
( y t− y t )
σ y2=1
n∑t=1
n
( yt− y t )
σ y=√ 1n∑t=1
n
( yt− yt )
V y=σ y
y⋅100
Y=β0+β1 xt+β2 x t2+εt
y t=b0+b1 x t+b2 x t2+e t
Model eksponencijalnog trenda se koristi za analizu onih pojava kod kojih frekvencije u
uzastopnim vremenskim intervalima imaju približno iste relativne promjene.
Opći oblik modela jednostavnog eksponencijalnog trenda je:
22