Statističke Metode Za Poslovno Upravljanje

STATISTIČKE METODE ZA POSLOVNO UPRAVLJANJE Josipa Rajić

METODE PROGNOZIRANJA

Za potrebe poslovnog upravljanja nužno je predviđanja procesa u poduzeću i njegovom

relevantnom okruženju. Za to se koriste različite metode prognoziranja.

Metode prognoziranja možemo podijeliti na:

- Statističke metode koriste podatke za prognoziranje pojava. Statistička metoda je

empirijska metoda, istraživanjem pojava u velikom broju njezinih pojavnih oblika

nastoji se doći do općeg zaključka o toj pojavi. Takvi zaključci se mogu donositi uz

određenu vjerojatnost i potrebno je provjeravati istinitost zaključaka (testiranje

hipoteza).

- Nestatističke metode se temelje na predviđanju kretanja pojava na osnovu analiza

financijskih i drugih podataka kojima se raspolaže, zatim na subjektivnim procjenama

na osnovama poznavanja tehnoloških promjena isl.

Statističke metode dalje dijelimo:

- Projekcijske

- Kauzalne

Projekcijske metode koriste analizu ponašanja pojave u prošlosti, i na osnovu utvrđenih

zakonitosti vrši se projekcija ponašanja pojave u budućnosti.

Modeli koji se rješavaju projekcijskim metodama imaju samo jednu varijablu. Nazivaju se još

i ekstrapolativne metode.

U ovu skupinu spadaju metode dekompozicije vremenske serije na komponente, metode

izglađivanja, ARIMA modeli.

Kauzalne metode vrše analizu efekata vanjskih utjecaja, a zatim se kreira model pomoću

kojeg se vrši prognoziranje. Kod ovih metoda imamo više varijabli, vrijednost pojave koja se

proučava prognozira se u zavisnosti od promjene drugih varijabli koje na nju utječu.Pojava

1

koja se proučava je zavisna varijabla, a pojave koje utječu na proučavanu varijablu su

nezavisne varijable. Zavisna varijabla je uvijek jedna pojava, a nezavisnih može biti jedna ili

više.U ovu skupinu metoda spadaju ekonometrijski modeli i regresijski modeli.

Podjela metoda prognoziranja s aspekta vremenskog perioda za koji se prognozira.

Prema ovom kriteriju imamo

- Dugoročne prognoze - prognoza na period od nekoliko godina unaprijed

- Srednjoročne prognoze – prognoze na period dvije do tri godine

- Kratkoročne prognoze – prognoze na period nekoliko tjedana, mjeseci do godinu

dana.

Primjena bilo koje statističke metode temelji se na raspoloživosti odgovarajućih podataka.

MODELI REGRESIJE

Razlikovanje determinističke i stohastične (ili statističke) zavisnosti pojava.

Određivanje smjera veze, jačine veze i oblika veze.

Opći oblik modela regresije je: Y= f (X , X , ... X ) + ε

Model se sastoji od determinističkog dijela, koji predstavlja matematičku funkciju kojom se

izražava zavisnost zavisne varijable od određenog broja nezavisnih varijabli, i stohastičnog

dijela koji predstavlja odstupanje od funkcionalne zavisnosti

Modele regresije možemo podijeliti s obzirom na broj nezavisnih varijabli uključenih u model

i s obzirom na oblik matematičke funkcije determinističkog dijela modela.

S obzirom na broj nezavisnih varijabli u modelu, modeli regresije se dijele na modele

jednostavne regresije i modele višestruke regresije.

Model jednostavne linearne regresije ima jednu zavisnu i jednu nezavisnu varijablu.

Model višestruke regresije ima jednu zavisnu i više nezavisnih varijabli.

2

Prema obliku matematičke funkcije determinističkog modela, modele regresije dijelimo na

linearne i nelinearne ili krivolinijske modele.

Veza među varijablama kod linearnog modela predočena je linearnom funkcijom, čiji je graf

pravac.

Veza između varijabli kod krivolinijske regresije ima oblik neke druge matematičke funkcije,

čiji je graf neka kriva linija.

Model jednostavne linearne regresije, opći oblik modela je:

U modelu jednostavne linearne regresije vrijednost zavisne varijable Y je linearna

kombinacija vrijednosti nezavisne varijable X, parametara modela i slučajne varijable.

Funkcionalni dio modela određen je ako su poznate vrijednosti parametara

Vrijednost parametara se procjenjuje na temelju uzorka ili izmjerenih n parova vrijednosti

varijable x i y.

Model sa procijenjenim parametrima je:

Vrijednost procijenjenih parametara se izračunava iz n izmjerenih parova vrijednosti x i y.

Regresijske vrijednosti se dobivaju uvrštavanjem odgovarajućih vrijednosti nezavisne

varijable x u model regresije.

Rezidualna odstupanja su odstupanja izmjerenih vrijednosti zavisne varijable od regresijskih

vrijednosti.

Model regresije je reprezentativniji što su manja rezidualna odstupanja.

Kakvoća modela se mjeri odgovarajućim pokazateljima, a najznačajniji su:

Varijanca ili prosječno kvadratno odstupanje, dobiva se tako da se zbroj kvadrata

rezidualnih odstupanja podijeli brojem podataka.

Standardna greška modela ili prosječno odstupanje podataka od regresijskih

vrijednosti, dobiva se kao pozitivni drugi korijen iz varijance.

3

y i=b0+b1 x i+e i

Koeficijent varijacije je omjer standardne devijacije i prosječne vrijednosti zavisne

varijable, pomnoženo sa 100.

U analizi reprezentativnosti regresijskog pravca koristi se koeficijent determinacije.

Koeficijent determinacije je relativna mjera prilagođenosti regresijskog pravca empirijskim

podacima.

Dobiva se kao omjer protumačenog dijela zbroja kvadrata odstupanja i ukupnog zbroja

kvadrata odstupanja.

Ukupno odstupanje empirijskih podataka (varijabla y) od prosječne vrijednosti varijable y se

rastavlja na dio odstupanja protumačen modelom regresije (razlika regresijske vrijednosti i

prosječne vrijednosti) i dio ne protumačen modelom (razlika izmjeđu izmjerene i regresijske

vrijednosti).

Koeficijent determinacije uzima vrijednosti iz intervala 0 i 1.

TESTIRANJE ZNAČAJNOSTI PARAMETARA MODELA REGRESIJE

Parametri općeg modela se procjenjuju na temelju izračunate vrijednosti odgovarajućeg

parametra koristeći n izmjerenih parova vrijednosti x i y. Izmjerene vrijednosti čine uzorak, a

statističkim zaključivanjem se nastoji doći do općih zaključaka (za osnovni skup).

Zbog toga je potrebno postupkom testiranja statističke hipoteze provjeriti jesu li vrijednosti

parametara statistički značajni.

U modelu jednostavne linearne regresije u stvari je bitna vrijednost parametra uz nezavisnu

varijablu, jer on pokazuje promjenu zavisne varijable za jedinično povećanje nezavisne

varijable. Vrijednost slobodnog člana modela ima uglavnom matematičko, a ne stvarno

značenje za zavisnost analiziranih pojava.

Regresijski koeficijent ili parametar uz nezavisnu varijablu je značajan ako je različit od nule,

jer povećanjem vrijednosti nezavisne varijable povećava se (reg.koeficijent veći od 0) ili se

smanjuje (reg.koeficijent manji od 0) vrijednost zavisne varijable. Ako je regresijski

4

koeficijent jednak 0 onda promjena nezavisne varijable ne utječe na vrijednost zavisne

varijable.

Za testiranje značajnosti regresijskog koeficijenta može se koristiti tzv. t-test ili F-test

T-test

Postupak testiranja polazi od postavke hipoteza, nulte i alternativne, koje u ovom slučaju

imaju sljedeći oblik:

H : β≠ 0

Test statistika je empirijski t- omjer:

Test statistika je distribuirana po studentovoj distribuciji s (n-2) stupnja slobode.

Odluka se donosi usporedbom empirijske vrijednosti s kritičnom vrijednosti t distribucije za

danu razinu signifikantnosti (1- ∝) i broj stupnjeva slobode. Nulta hipoteza se prihvaća ako

je

a ako je

odbacuje se nulta i prihvaća alternativna hipoteza.

F- test ili analiza varijance (ANOVA)

Analiza varijance je metoda matematičke statistike koja se temelji na raščlanjivanju ukupnog

zbroja kvadrata odstupanja (SST) izmjerenih vrijednosti zavisne varijable od njezine

aritmetičke sredine na komponente koje opisuju određene izvore varijacija, a to su zbroj

protumačenih kvadrata odstupanja (SSP) i zbroj neprotumačenih (rezidualnih) kvadrata

odstupanja (SSR)

Rezultati izračuna se upisuju u tablicu tzv. tablicu ANOVA.

Postupak testiranja

Izračuna se vrijednost empirijskog F0 – omjera

5

H0 : β1=0

t0=b1

σ ( β1 )

|t0|≤t (α /2; n−2 )

|t0|>t (α /2 ;n−2 )

∑i=1

n

( y i− yi )2=∑i=1

n

( y i− yi )2+∑i=1

n

( yi− y i )2

F0 - omjerima F- oblik distribucije, što znači da se uspoređuje izračunata vrijednost sa

tabličnom vrijednosti F – distribucije, za izabranu razinu signifikantnosti testa ( 1 – α ) i za

odgovarajući broj stupnjeva slobode veličine u brojniku i veličine u nazivniku

Ako je izračunata vrijednost F0 -omjera manja od odgovarajuće tablične vrijednosti, to znači

da se razlika između protumačene i rezidualne procjene varijance mogu pripisati slučaju i da

treba prihvatiti nultu hipotezu (regresijski koeficijent nije značajan), u protivnom se odbacuje

nulta i prihvaća alternativna hipoteza da je regresijski koeficijent značajan .

INTERVALNA PROCJENA PARAMETARA MODELA REGRESIJE

Parametri modelaβ i β se procjenjuju intervalno i to pomoću parametara bi b koji su izračunati

pomoću podataka iz uzorka.

- Parametri b i b izračunati za različite uzorke predstavljaju slučajne varijable, koje imaju

normalan oblik distribucije (za uzorke preko 30 statističkih jedinica ili T oblik distribucije za

manje uzorke).

Očekivana vrijednost sampling-distribucije parametra b jednaka je parametru β općeg

modela (E(b ) = β ¿ , a standardna devijacija se označava i naziva se standardna greška

procjene parametraβ .

Intervalna procjena slobodnog člana modelaβ uz pouzdanost ( 1 – α ) dobiva se pomoću

izraza:

b - je slobodni član model procijenjen pomoću n izmjerenih parova vrijednosti varijabli X i Y-

(x , y )

σ ¿ ) - je standardna greška procjene parametra β a izračunava se pomoću izraza

U navedenom izrazu veličina je procijenjena varijanca općeg modela (osnovnog skupa), a

procjena se vrši na osnovu varijance procijenjenog modela (uzorka).

Veličina je kritična vrijednost t distribucije za vrijednost funkcije i (n-2) stupnja slobode.

6

Očekivana vrijednost sampling distribucije parametra jednaka je parametru općeg modela,

a standardna devijacija se naziva standardna greška procjene parametra .

Intervalna procjena regresijskog koeficijenta općeg modela uz pouzdanost dobiva

se pomoću izraza:

Standardna pogreška procjene parametraβse izračunava pomoću izraza:

Intervalna procjena vrijednosti zavisne varijable za poznatu vrijednost nezavisne varijable

Procjena vrijednosti zavisne varijable za zadanu vrijednost nezavisne varijable može biti

procjena brojem i intervalom.

Neka je zadana vrijednost nezavisne varijable x procijenjena vrijednost se dobiva pomoću

izraza

Intervalna procjena vrijednosti zavisne varijable za zadanu vrijednost nezavisne varijable ,

uz pouzdanost x ima oblik:

Standardna greška za intervalnu procjenu prosječne vrijednosti zavisne varijable za zadanu

vrijednost nezavisne varijable ima oblik

Standardna greška za procjenu intervala individualnih vrijednosti zavisne varijable za zadanu

vrijednost nezavisne varijable je

NELINEARNI REGRESIJSKI MODEL

Kod svih modela regresije radi se o statističkoj međuzavisnosti pojava, pa modeli imaju

funkcionalni dio i slučajnu promjenjivu.

7

σ ( β1 )=√ σ2

∑i=1

n

x i2−n x2

P (b1−t (α /2 ; n−2)⋅σ (β1)<β1<b1+t(α /2; n−2)⋅σ ( β1))=(1−α )

y0=b0+b1 x0

P ( y0−t (α /2; n−2 )⋅σ ( y0 )<Y 0< y0−t (α /2 ; n−2 )⋅σ ( y0) )=(1−α )

σ ( y0)=σ √ 1n+

(x0− x )2

∑i=1

n

x i2−n x2

σ ( y0)=σ √1+1n+

(x0− x )2

∑i=1

n

x i2−n x2

Analiza funkcionalnog dijela zavisi od oblika funkcije koji se koristi, a analiza rezidualnih

odstupanja se provodi na isti način bez obzira na oblik funkcije. Zbog toga je kod krivolinijskih

modela navedena analiza samo funkcionalnog dijela.

Analiza rezidualnih odstupanja provodi se izračunavanjem istih pokazatelja

reprezentativnosti kao kod linearnog modela.

Funkcionalni dio eksponencijalni model ima oblik:

Logaritmiranjem izraza dobiva se linearizirani model:

Analiza transformiranog modela provodi se na isti način kao kod linearnih modela, uz

napomenu da je kod interpretacije rezultata nužno voditi računa koje su varijable ili

parametri transformirani.

U navedenom modelu izvršena je transformacija zavisne varijable i koriste se logaritamske

vrijednosti varijable .

Vrijednosti parametara koji se procjenjuju pomoću empirijskih vrijednosti se dobivaju u

logaritamskim vrijednostima.

Model s procijenjenim parametrima, koji se izračunavaju na osnovu izmjerenih n parova

vrijednosti varijabli X i Y, , u originalnom i transformiranom obliku glasi:

Vrijednost parametara, odnosno njihovih logaritamskih vrijednosti se dobiva pomoću izraza:

Vrijednost parametara originalnog modela dobiva se antilogaritmiranjem.

Parametar predstavlja vrijednost zavisne varijable kada nezavisna varijabla ima

vrijednost nula. Kao i kod linearnog modela uglavnom nema stvarno značenje.

Vrijednost parametra pokazuje relativnu promjenu zavisne varijable za jedinično relativno

povećanje nezavisne varijable. Tumači se uglavnom kao postotna promjena. Znači, ako se

nezavisna varijabla poveća za 1% zavisna varijabla će se promijeniti u postotcima za iznos

pomnožen sa sto.

8

y i=β0 β1

xi

log { y i=log β0+ log β1⋅xi¿

( log yi )

y i=b0 b1

xi log { y i=log b0+log b1⋅x i¿

(x i , y i )

log b1=∑i=1

n

x i⋅log yi−n⋅x⋅log y

∑i=1

n

x i2−n⋅x2

log b0=log y−logb1⋅x

b0

b1

b1

Logaritamski model koristi transformaciju nezavisne varijable ( ), a opći oblik regresije je:

Model s procijenjenim parametrima koji se dobiju pomoću izmjerenih n parova vrijednosti

zavisne i nezavisne varijable, ima oblik:

Vrijednosti parametara procijenjenog modela se izračunavaju pomoću izraza:

Parametar predstavlja vrijednost zavisne varijable kada je nezavisna varijabla jednaka

jedan .

Parametar pokazuje prosječno linearno povećanje zavisne varijable kada se logaritam

nezavisne varijable poveća za jedan (vrijednost logaritma 0, 1, 2, 3, 4,… imaju redom brojevi

1, 10, 100, 1000, 10000,…)

Recipročni model regresije ima oblik:

Korištenjem recipročne vrijednosti za zavisnu varijablu , model se transformira u

linearni oblik:

MODEL POLINOMSKE REGRESIJE

U izboru tipa krivulje koja je najbolje prilagođena točkama u dijagramu rasipanja može se

poći od modela polinomske regresije. Opći oblik polinomske regresije je:

Koeficijenti polinoma , su parametri modela regresije koje treba procijeniti. Procjena

parametara vrši se pomoću izmjerenih n parova vrijednosti zavisne i nezavisne varijable , a

model s procijenjenim parametrima ima oblik:

U modelu polinomske regresije vrijednost zavisne varijable je kombinacija nepoznatih

parametara , numeričkih vrijednosti nezavisne varijable s različitim

stupnjevima i nepoznatih vrijednosti slučajne varijable.

9

y i=β0+β1 log x i

log x i

y i=b0+b1 log x i(x i , y i )

b1=∑i=1

n

log x i⋅y i−n⋅log x⋅y

∑i=1

n

( log x i )2−n⋅(log x )2

b0= y−b1⋅log x

( log 1=0 )b0

y i=1

β0+ β1 x i

b1

( 1y i )

1y i

=β0+β1 x i

y i=β0+β1 xi+β2 xi2+.. . .+ β j x i

j+ .. ..+βk xik

y i

β j

y i=b0+b1 x i+b2 x i2+.. . .+b j x i

j+. . ..+bk x ik

(x i , y i )

( j=1,2 ,. .. , k )β j

Ovdje je prikazan samo funkcionalni dio modela, a analiza slučajne varijable ili rezidualnih

odstupanja se provodi na isti način kao kod modela jednostavne linearne regresije.

Procjena parametara se provodi metodom minimalnih kvadrata odstupanja, slično kao kod

modela jednostavne linearne regresije, samo je broj normalnih jednadžbi jednak broju

nepoznatih parametara.

U zavisnosti od vrijednosti k imamo polinome različitog stupnja. Za k=1 imamo polinom

prvog stupnja ili linearnu funkciju; za k = 2 polinom je drugog stupnja ili kvadratna funkcija

čiji graf je parabola; za k =3 polinom je trećeg stupnja…

Teorijski k može uzeti bilo koju vrijednost iz skupa prirodnih brojeva, ali se u praksi koriste

uglavnom polinomi drugog i trećeg stupnja.

Porastom stupnja polinoma, procjena parametara modela polinomske regresije postaje

matematički znatno složenija, a javlja se i problem tumačenja izračunatih parametara.

Za model kvadratne regresije procijenjeni model ima oblik:

Graf kvadratne funkcije je parabola, a procjena regresijskih koeficijenata , i se

dobiva rješavanjem sustava normalnih jednadžbi:

VIŠESTRUKA LINEARNA REGRESIJA

Opći oblik modela višestruke linearne regresije je:

Model ima jednu zavisnu varijablu i m nezavisnih varijabli.

Parametri modela su ,

10

y i=b0+b1 x i+b2 x i2

b0

b0n +b1∑i=1

n

xi+b2∑i=1

n

x i2=∑

i=1

n

y i

b0∑i=1

n

x i+b1∑i=1

n

x i2+b2∑

i=1

n

x i3=∑

i=1

n

x i y i

b0∑i=1

n

x i2+b1∑

i=1

n

xi3+b2∑

i=1

n

xi4=∑

i=1

n

x i2 y i

Y=β0+β1 X1+β2X 2+. .. .+β j X j+. . ..+βm Xm+E

( j=1,2 ,. .. , k )β j

Slobodni član modela (matematičko značenje) pokazuje vrijednost zavisne varijable kada su

vrijednosti svih m - nezavisnih varijabli jednake nula, uglavnom u modelu nema značenje.

Parametri uz nezavisne varijable – pokazuju za koliko se u prosjeku promijeni vrijednost

zavisne varijable kada se nezavisna varijabla (čiji parametar tumačimo) poveća za jedinicu

pod uvjetom da vrijednosti ostalih varijabli ostanu nepromijenjene.

PROJEKCIJSKE METODE PROGNOZIRANJA ILI PROGNOZIRANJE PUTEM VREMENSKIH SERIJA

Statističke pojave se mijenjaju tijekom vremena. Dinamika promjena pojava se prati pomoću

vremenskog niza.

Vremenski niz ili vremenska serija je skup kronološki uređenih podataka kojima se prate

promjene neke statističke pojave.

Podaci koji tvore niz nazivaju se članovi niza, frekvencije ili razina pojave. Označavaju se:

gdje je - frekvencije vremenskog niza, a t – brojač vremenskih intervala ili vremenskih

točaka na koje se odnose podaci.

Broj članova niza n označava duljinu niza.

Podaci u vremenskom nizu se uvijek odnose na prošle vremenske periode.

Smisao analize vremenskog niza jeste otkrivanje zakonitosti u razvoju pojave koja se

modelira kako bi se te zakonitosti mogle projicirati na budućnost i izvršiti prognoza pojave za

naredno, duže ili kraće razdoblje.

Klasifikacija vremenskih nizova moguća je prema različitim kriterijima, a najčešće su korišteni

svojstvo kumulativnosti i način formiranja frekvencija vremenskog niza.

Prema svojstvu kumulativnosti vremenski nizovi se dijele na intervalne i trenutačne.

Intervalni vremenski niz prikazuje kretanje pojave u sukcesivnim vremenskim intervalima i

ima svojstvo kumulativnosti.

11

y1 , y2 , .. . , y t , .. . , yny t

Frekvencije mu nastaju zbrajanjem vrijednosti pojave po kraćim intervalima. Da bi

frekvencije bile usporedive, nužno je da intervali budu jednaki.

Podaci u intervalnom vremenskom nizu se mogu zbrajati i zbroj ima značenje.

Trenutačni vremenski niz predstavlja kronološki uređene podatke o stanju pojave u točno

određenim vremenskim točkama.

Frekvencije trenutačnog niza po pravilu predočuju stanje pojave u precizno izabranim i

jednako udaljenim vremenskim točkama. Ako se ne raspolaže frekvencijama po svim jednako

udaljenim točkama vremenskog razdoblja u kojemu se prati neka pojava frekvencije niza su i

tada usporedive.

Trenutačni vremenski niz nema svojstvo kumulativnosti pa se frekvencije ne zbrajaju jer

zbroj nema konkretno značenje.

Prema načinu formiranja frekvencija nizovi mogu biti izvorni i izvedeni.

Frekvencije izvornog niza nastaju neposrednim mjerenjem pojave u odabranim intervalima

vremena ili u odabranim vremenskim točkama.

Frekvencije izvedenog vremenskog niza nastaju računskim operacijama nad frekvencijama

jednog ili više vremenskih nizova. Računskim operacijama nad frekvencijama jednog

vremenskog niza mogu se izračunati promjene pojave po vremenskim periodima niza u

apsolutnim i relativnim iznosima, indeksni brojevi i slično. Izračunavanjem omjera frekvencija

dvaju nizova, dobivaju se različiti koeficijenti koji se mogu koristiti u analizi pojava.

Prije korištenja i analize vremenskog niza nužno je provjeriti je li usporedivost frekvencija

narušena. Ako su frekvencije usporedive kaže se da je vremenski niz konzistentan.

Usporedivost frekvencija može biti narušena: promjenom definicije pojave tijekom vremena

promatranja, prostornom promjenom administrativne jedinice za koju je vezana pojava i

različitim vremenskim intervalima definirane vremenske jedinice.

Analizu vremenskih serija obuhvaća:

definicija cilja analize;

12

analiza promatrane pojave u stvarnim uvjetima funkcioniranja;

prikupljanje i klasifikacija numeričkih podataka;

analiza konzistentnosti prikupljenih podataka;

izrada preliminarnog modela podataka;

kreiranje matematičkog modela za dinamičko promatranje pojave;

izrada programa za računalsku obradu ili odabir programskog paketa za obradu

podataka;

računalska obrada podataka;

analiza rezultata obrade;

analiza kakvoće matematičkog modela;

prognoziranje dinamičkog ponašanja promatrane pojave pomoću matematičkog

modela;

implementacija modela vremenske serije u praksi.

U analizi vremenskih serija koriste se različiti modeli i metode. Izbor odgovarajućih metoda i

modela zavisi od postavljenog cilja analize i karakteristika pojave koja je predočena

vremenskom serijom.

Prvi korak u analizi je grafički prikaz pomoću dijagrama rasipanja (scatter diagram). Dijagram

rasipanja daje jasnu sliku o kretanju pojave i ukazuje na mogući tip matematičkog modela

koji bi mogao reprezentirati raspoložive podatke vremenske serije.

Dinamičkom analizom vremenske serije može se utvrditi postojanje komponenti, i to trend, ciklične i

sezonske komponente. Ove komponente se nazivaju sistemske, rezultat su postojanja određenih

zakonitosti u razvoju pojave i mogu se modelirati.

Svaki vremenski niz ima slučajnu komponentu, jer se radi o statističkim podacima čija

vrijednost nije određena determinističkim procesima.

13

Trend komponenta pokazuje dugoročnu tendenciju u razvoju pojave. Većina vremenskih

nizova ima podatke koji izražavaju zakonitost u povećanju ili smanjenju pojave, bilo da se

radi o ravnomjernim promjenama u apsolutnim ili relativnim iznosima.

Cikličnu komponentu ima vremenski niz koji prikazuje pojavu koja se ponavlja na približno

jednak način u intervalima vremena dužim od godinu dana. Postojanje ciklične komponente

prema određenom modelu nije nužno kod svake vremenske serije.

Sezonsku komponentu ima vremenska serija podataka o pojavi koja se ponavlja na približno

isti način tijekom jedne godine. Da bi se analizirala ova komponenta, podaci se moraju

odnositi na mjesečne ili kvartalne vrijednosti frekvencija.

Vremenske serije u kojima individualne numeričke vrijednosti osciliraju oko neke konstantne

vrijednosti u određenom vremenskom periodu, nazivaju se konstantne serije.

Konstantne serije nemaju sistemske komponente, samo imaju slučajnu komponentu ili

slučajna odstupanja.

Statistička stacionarnost predstavlja karakteristiku vremenske serije za koju su njezine

osnovne statistike (srednja vrijednost, varijanca, autokorelacija itd.) konstantne tijekom

vremena.

Većina statističkih metoda se temelji na pretpostavci o približnoj stacionarnosti vremenskih

serija, odnosno na pretpostavci da se promatrana vremenska serija može stacionalizirati

primjenom matematičkih transformacija.

BROJČANA ANALIZA VREMENSKIH SERIJA

Pokazatelji dinamike su brojčane veličine kojima se izražavaju promjene u dinamici

vremenske serije.

Promjene frekvencija vremenske serije se mogu pratiti u odnosu na prethodno razdoblje ili

kao promjene prema frekvenciji odabranog baznog razdoblja.

Pokazatelji kojima se prati promjena razine pojave u uzastopnim razdobljima su: prve

diferencije, diferencije drugog ili višeg reda, koeficijent dinamike i stope promjene.

14

Navedeni pokazatelji se mogu odrediti kao pojedinačni, određuju se za sve članove niza

(osim prvog) i opisuju promjenu pojave u tekućem razdoblju u odnosu na prethodno

razdoblje.

Za pojedinačne pokazatelje može se odrediti prosječna vrijednost koja opisuje prosječnu

promjenu pojave u navedenom razdoblju.

Prve diferencije su pojedinačne mjere promjene pojave u uzastopnim razdobljima, izražene

u apsolutnim iznosima i mjernim jedinicama pojave.

Ako su vrijednosti vremenske serije, prve se diferencije dobiju kao

Prvih diferencija ima (n-1), jer se ne može odrediti za prvo razdoblje.

Prosječna prva diferencija se izračunava kao aritmetička sredina pojedinačnih promjena.

Definira se izrazom:

Diferencije drugog reda su mjere promjene prvih diferencija u uzastopnim razdobljima.

Dobivaju se pomoću izraza: t = 3,4,…, n

Analogno se izračunavaju diferencije trećeg reda kao razlika diferencija drugog reda itd.

Diferencije drugog i višeg reda su neprikladne za objašnjenje dinamike pojave i uglavnom

služe za izbor odgovarajućeg modela trenda.

Koeficijent dinamike je relativni broj kojim se opisuju promjene pojave u uzastopnim

razdobljima u relativnom iznosu.

Dobiva se kao omjer frekvencija tekućeg i prethodnog razdoblja t= 2, 3,…n

Može se odrediti za sve članove niza (osim prvog), pa predstavlja pojedinačnu mjeru.

Prosječna vrijednost koeficijenata dinamike se računa kao geometrijska sredina pojedinačnih

pokazatelja.

Kao relativni pokazatelji promjena pojave u vremenu, koeficijenti dinamike su pogodni

zauspoređivanje dinamike promjena raznorodnih pojava.

15

t=2,3 , .. . , nΔy t= y t− y t−1y1 , y2 , .. . , y t , .. . , yn

Δy=yn− y1

n−1Δy=

( y2− y1)+( y3− y2)+. . .+ ( yn− yn−1)n−1

Δ(2) y t=Δyt−Δyt−1

ν t=y t

y t−1

Stope promjene predstavljaju postotnu promjenu pojave u uzastopnim razdobljima.

Pojedinačne stope promjene definiraju se izrazom t = 2,3,..n

Stope promjene se mogu računati pomoću koeficijenta dinamike. Ako se razvije prethodni

izraz, dobiva se:

Označi li se u prethodnom izrazu koeficijent dinamike sa , dobiva se relacija za stope

promjene preko koeficijenta dinamike:

Ovaj izraz ima posebnu važnost za računanje prosječne stope promjene

Prosječna stopa promjene se računa kao geometrijska sredina pojedinačnih stopa. S

obzirom da stope mogu biti jednake nuli ili negativni brojevi, što stvara problem kod

računanja, koristi se geometrijska sredina koeficijenata dinamike

Dinamika neke pojave se može pratiti pomoću pokazatelja o odnosu frekvencija vremenske

serije prema frekvenciji odabranog baznog razdoblja. Promjene frekvencija mogu se pratiti

u apsolutnim i relativnim iznosima. Apsolutne mjere mogu biti prve, druge ili diferencije

višeg reda, a relativna mjera je stopa promjene u odnosu na bazno razdoblje.

Indeksi vremenskog niza su relativni brojevi koji pokazuju odnose stanja pojave u različitim

vremenskim razdobljima ili vremenskim točkama.

Dobivaju se kao omjer frekvencija tekućeg i baznog razdoblja. Prema složenosti pojave koju

prate, indeksi mogu biti individualni i skupni.

Mogu biti bazni i verižni. Bazni indeksi jednog vremenskog niza imaju istu izabranu bazu, a

verižni indeksi imaju za bazu razinu pojave u prethodnom razdoblju.

Verižni indeksi su relativni brojevi koji pokazuju koliko jedinica pojave u tekućem razdoblju

dolazi na svakih 100 jedinica pojave u prethodnom razdoblju. Izraz za računanje verižnih

indeksa je:

16

st=Δy ty t−1

⋅100=y t− y t−1

y t−1

⋅100

st=y t− y t−1

y t−1

⋅100=( y ty t−1

−y t−1

y t−1)⋅100=( y t

y t−1

−1)⋅100

st=(ν t−1 )⋅100

G=n−1√ yn

y1G=n−1√ν2⋅ν3⋅. ..⋅ν t⋅.. .⋅νn=n−1√ y2

y1

⋅y3

y2

⋅.. ..⋅yn−1

yn−2

⋅ynyn−1

s= (G−1 )⋅100

t=2,3 .. . . ,nV t=y ty t−1

⋅100

Bazni indeksi su relativni brojevi kojima se prate varijacije vremenske serije u odnosu na

odabrani (bazni) vremenski interval ili vremensku točku. Izraz za izračunavanje baznih

indeksa je:

MODELIRANJE VREMENSKIH SERIJA

Modeliranje vremenskih serija predstavlja proces iznalaženja mogućih relacija (formula) koje

opisuju kretanje određene pojave u vremenu.

S obzirom da pojave koje se prate statistički imaju stohastični karakter, kažemo da se radi o

slučajnoj varijabli.

Slučajna varijabla se modelira statističkim modelima, koji pored determinističkog dijela

(matematičke formule) imaju i slučajnu, neregularnu varijablu.

Iznalaženjem odgovarajućeg modela vremenske serije mogu se utvrditi zakonitosti u razvoju

neke pojave.

Projiciranjem utvrđenih zakonitosti na buduće kretanje pojave vrši se prognoziranje.

MODEL JEDNOSTAVNIH PROSJEKA

Najjednostavniji model vremenske serije je model jednostavnih prosjeka.

Deterministički dio modela vremenske serije je prosječna vrijednost izmjerenih vrijednosti.

Model ima oblik

Reprezentativnost modela se mjeri varijancom, standardnom devijacijom i koeficijentom

varijacije

Ovaj model je opravdano koristiti ako frekvencije vremenske serije osciliraju oko neke

konstante, odnosno ako pokazatelji reprezentativnosti modela upućuju da je greška modela

prihvatljiva.

17

t=1,2 ,. . ., nI t=y tyb

+100

y=1n∑t=1

n

yty=μ= yy t=μ+εt

V y=σ y

y⋅100σ y

2=1n∑i=1

n

( y i− y i )2

F t+1=F t+2=F t+3= .. ..=μ

Prognoze pojave za sve vremenske periode je ista vrijednost.

Model jednostavnih prosjeka je jednostavan za korištenje, ali su pojave koje se tijekom

vremena ne mijenjaju veoma rijetke, naročito ako se radi o duljem vremenskom periodu.

Osnovni nedostatak metode jednostavnih prosjeka je bio da daje istu važnost starijim kao i

novijim podacima.

Ovaj nedostatak se može otkloniti modeliranjem vremenske serije pomoću pokretnih

prosjeka.

Jednostavni pomični prosjeci su aritmetičke sredine - m uzastopnih vrijednosti vremenske

serije.

Na taj način originalna serija se zamjenjuje pomičnim prosjecima, a prognoza pojave se

provodi pomoću serije pomičnih prosjeka.

Pomični prosjeci smanjuju kolebanja u vremenskoj seriji, smanjuje se utjecaj sezonskih i

neregularnih komponenti, dok se utjecaj trend i ciklične komponente jasnije manifestira.

Model ima oblik

! U modelu m označava red pomičnih prosjeka ili broj individualnih vrijednosti vremenska

serije uključenih u prosjek. Tako, ako imamo prosjeke trećeg reda, pomični prosjek se

određuje za četvrti vremenski period kao prosjek tri prva podatka, za peti i naredne periode

do kraja vremenske serije uzima se prosjek frekvencija tri perioda koja neposredno prethode

tom periodu.

Mogu se koristiti prosjeci drugog, trećeg ili višeg reda.

U jednostavnim prosjecima svaka od m vrijednosti uključenih u izračunavanje ima isto

značenje ili ponder.

Pored metode jednostavnih pomičnih prosjeka koristi se i metoda ponderiranih (vaganih)

prosjeka.

18

t=m ,m+1 , .. . , nF t+1=1m

∑i=t−m+1

t

y i

Kod ove metode svakoj od m vrijednosti uključenih u izračunavanje prosjeka dodjeljuje se

različit ponder. Zbroj pondera treba biti jednak jedan.

Metoda pomičnih prosjeka se često koristi u praksi.

Broj frekvencija koje se uključuju u izračunavanje pomičnih prosjeka je konstantan i utvrđuje

se na temelju iskustva.

Reprezentativnost modela provodi se izračunavanjem prosječne greške, prosječnog

apsolutnog odstupanja i zbroja kvadrata grešaka.

MODEL EKSPONENCIJALNOG IZGLAĐIVANJA

Najčešće korištena metoda izglađivanja vremenske serije je metoda eksponencijalnog

izglađivanja.

Prognozirane vrijednosti u stvari predstavljaju vrijednost ponderiranog prosjeka svih

frekvencija u nizu starijih od perioda prognoze. Ponderi se dodjeljuju prema pravilima koje

određuje eksponencijalna funkcija.

Znači vrijednost pondera je najveća za podatak koji neposredno prethodi prognoziranoj

vrijednosti, a za starije podatke eksponencijalno opada što su podaci udaljeniji od vremena

prognoze.

Model eksponencijalnog izglađivanja se može napisati kao:

Vrijednosti dobivene metodom eksponencijalnog izglađivanja u stvari predstavljaju

ponderirani prosjek prethodne frekvencije u nizu i prognoze za taj period.

Kod modela eksponencijalnog izglađivanja potrebno je odrediti ponder za najnoviju

vrijednost vremenske serije kao i početnu prognostičku vrijednost.

Za vrijednost obično se uzimaju vrijednosti iz intervala od 0,1 do 0,2.

Za početnu procjenu se može uzeti prva vrijednost u seriji, aritmetička sredina prvih šest ili

aritmetička sredina svih frekvencija u nizu

19

t=m ,m+1 , .. . , nF t+1=1m

∑i=t−m+1

t

y iwi

y=ax

F t+1=αyt+(1−α ) Ft

Optimalna vrijednost konstante izglađivanja se određuje minimizacijom rezidualne greške.

Za mjerenje rezidualne greške se koriste standardni pokazatelji kao što su standardna

devijacija, prosječno apsolutno odstupanje, koeficijent varijacije i dr.

U praksi se često koristi drugi korijen iz srednje kvadratne rezidualne greške, koja uzima u

obzir i prosječnu vrijednost rezidualne greške kao i standardnu devijaciju rezidualne greške.

MODELI TRENDA

Model trenda predstavlja analitički izraz kojim se opisuje dugoročna tendencija u razvoju

istraživane pojave.

Opći oblik modela trenda je , gdje je Y pojava predočena vremenskom serijom,

nepoznata funkcija vremena, a e nepoznata slučajna odstupanja od trenda s obilježjima

slučajne varijable.

Za izbor oblika funkcije koristi se dijagram rasipanja.

Pokazatelji dinamike također mogu poslužiti za izbor oblika funkcije u modelu trenda

Ako su prve diferencije približno jednake, linearna funkcija najbolje aproksimira

empirijske podatke vremenskog niza.

Za vremensku seriju s približno istim vrijednostima drugih diferencija, preporuča se

korištenje paraboličnog trenda.

Ako vremenska serija ima približno jednake stope promjene, najbolje je koristiti

eksponencijalni trend.

Za linearni model trenda opći oblik je:

Analizira li se model sa stajališta deskriptivne statistike, procijenjeni model određen na

temelju ograničenog broja podataka ima oblik:

20

Se=√ 1n−1

∑t=1

n

(e t−e )2e=1n∑t=1

n

etRMPSE=√ e2+se2

Y=f (t )+e

f ( t )

Y=β0+β1 xt+εt

y t=b0+b1 x t+et

Parametar je slobodni član modela i predstavlja vrijednost pojave u nultom razdoblju,

odnosno u razdoblju koje prethodi prvom razdoblju za koji je mjerena vrijednost pojave.

Parametar je koeficijent trenda koji pokazuje prosječnu promjenu pojave iz razdoblja u

razdoblje.

Parametri modela se izračunavaju pomoću formula

Pojedinačne vrijednosti trenda se dobivaju uvrštavanjem vrijednosti varijable vrijeme u

deterministički dio modela i nazivaju se trend vrijednosti.

Deskriptivno-statistička analiza reprezentativnosti modela trenda polazi od odstupanja

izmjerenih vrijednosti pojave i trend vrijednosti .

Ovo su pojedinačna rezidualna odstupanja, a prosječno odstupanje se računa preko kvadrata

odstupanja.

Prvo se računa prosječno kvadratno odstupanje ili varijanca. Izraz za varijancu je:

Pozitivni drugi korijen iz varijance je standardna devijacija ili standardna greška modela

trenda.

Prosječna relativna mjera se dobiva stavljanjem u odnos standardne greške modela trenda i

prosječne vrijednosti pojave koja se modelira. Dobivena mjera se naziva koeficijent varijacije.

Za mjerenje reprezentativnosti modela trenda koristi se koeficijent determinacije.

Ako su druge diferencije vremenske serije približno jednake, može se koristiti polinom

drugog stupnja ili kvadratna funkcija za model trenda.

Graf kvadratne funkcije je parabola pa se ovaj model naziva parabolični trend.

Opći oblik paraboličnog modela trenda je:

Model s procijenjenim parametrima dobijem iz n- izmjeren vrijednost vremenske serije je:

21

b1

b0

b0= y−b1 xb1=∑t=1

n

x t y t−n x⋅y

∑t=1

n

x t2−n x2

y t=b0+b1 x t

( y t− y t )

σ y2=1

n∑t=1

n

( yt− y t )

σ y=√ 1n∑t=1

n

( yt− yt )

V y=σ y

y⋅100

Y=β0+β1 xt+β2 x t2+εt

y t=b0+b1 x t+b2 x t2+e t

Model eksponencijalnog trenda se koristi za analizu onih pojava kod kojih frekvencije u

uzastopnim vremenskim intervalima imaju približno iste relativne promjene.

Opći oblik modela jednostavnog eksponencijalnog trenda je:

22

Documents

Statističke Metode Za Poslovno Upravljanje