Lucija Biljeke

Embed Size (px)

Citation preview

Biljeke Ekonometrijska radionica

Biljeke Ekonometrijska radionica

qwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmrtyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmrtyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmrtyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmrtyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmrtyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmrtyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmrtyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnm

Biljeke Ekonometrijska radionicaEKONOMETRIJA 2012./2013.VJEBE 9, 10, 12 i 15

Sadraj1.EKONOMETRIJA POJAM I ZNAENJE22.PODACI22.1.Koliko podataka prikupiti odnosno koji je minimalni potrebni uzorak?82.2.Ogranienja podataka82.3.Strukture podataka83.PRIMJER i PODSJETNIK104.E-VIEWS174.1.UNOS PODATAKA174.2.DESKRIPTIVNA STATISTIKA194.3.Transformacije i matematike operacije s podacima264.4.Hodrick-Prescott filter265.INFERENCIJALNA STATISTIKA275.1.PARAMETAR I PROCJENITELJ275.2.SVOJSTVA PROCJENITELJA276.MODEL JEDNOSTAVNE LINEARNE REGRESIJE296.1.POLAZNE PRETPOSTAVKE U ANALIZI MODELA JEDNOSTAVNE LINARNE REGRESIJE306.2.NARUAVANJE PRETPOSTAVKI306.2.1.MULTIKOLINEARNOST REGRESORSKIH VARIJABLI316.2.2.HETEROSKEDASTINOST (problem promjenjivosti varijance)346.2.3.AUTOKORELACIJA GREAKA RELACIJE376.2.4.NENORMALNOST GREAKA RELACIJE437.PRIVIDNA REGRESIJA448.DODATAK: Jednostavna i viestruka linearna regresija u Excelu uz dodatak PHStat459.P.S.50

1. EKONOMETRIJA POJAM I ZNAENJE

Najjednostavnije reeno, ekonometrija je mjerenje u ekonomiji (ekono + metrija). Za poetak nas zanima postoji li povezanost (koreliranost) izmeu dviju ili vie ekonomskih varijabli te, ukoliko postoji, kojeg je smjera i jaine. Temelj svake analize bi trebao biti dobro poznavanje ekonomske teorije i stvarnosti. Potrebno je razlikovati deterministiko od stohastikog. Ako kaete y =2x, rije je o deterministikoj jednadbi, jer za svaki zadani x, tono znamo koliki je y. Ako je x=3, y je 6, ako je x=4, y iznosi 8 itd.

Ono to se u ekonometrije i najvie promatra je greka relacije (), a onda spada u stohastiku komponentu.

y=2x + Za poetak, nema mjerenja ako nema podataka. Zato prvo kreemo s podacima i gdje ih moemo nai.2. PODACI

Bez podataka ne moete nita. Zato uvijek najprije provjerite postoje li podaci za ono to biste eljeli analizirati. Kada provodite analizu za Hrvatsku, pronalaenje podataka (i dovoljno dugake serije podataka) je zapravo najtei posao.Postoji puno izvora podataka u svijetu, no navest emo vam samo one znaajnije.Ako traimo za RH dva su mjesta, DZS ili HNB, ovisno o tom koje varijable traimo.1. DRAVNI ZAVOD ZA STATISTIKU (www.dzs.hr) Za to na DZS-u traimo podatke? BDP, investicije, osobna potronja, stanovnitvo, zaposlenost, nezaposlenost, plae, uvoz, izvoz cijene i brojni drugi podaci o realnom sektoru (industrija, poljoprivreda, turizam, trgovina, energija itd.) KLIKNETE NA OBJAVLJENI PODACI

2. HRVATSKA NARODNA BANKA (www.hnb.hr)Za to na HNB-u traimo podatke? teaj, cijene, platna bilanca, strana ulaganja, kamatne stope, monetarni agregati itd.

Podatke za Europu, a tako i RH moete pronai i na Eurostatu (Eurostat preuzima od DZS-a podatke).

3. EUROSTAT (http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/)

Kliknete na DATABASE i dobijete:

Kada kliknete na jednu od razgranatih komponenti dobit ete tablicu s velikim brojem podataka, ali trebate se koncentrirati na samo dva gumba:1. select data2. download

GEO- birate zemlje koje vas zanimajuINDIC_NA odaberete indikatore (BDP, potronja)TIME-birate vremenski horizontUNIT- tu birate mjernu jedinicu (mil, indeksi, %, promjena)Kad ste sve odabarli, stisnete download

Ako vas ne zanima Europa, nego ostatak svijeta, onda moete traiti podatke na sljedeim stranicama:www.worldbank.org danaby country (moe i by topic) odaberete zemlju download danawww.imf.org dana and statisticsdanaWEO (World Economic Outlook Databases) (najbolja je IFS)www.imd.orgwww.cia.org World Factbook.

2.1. Koliko podataka prikupiti odnosno koji je minimalni potrebni uzorak?

Velikim uzorkom ste na kolegiju Statistika nazivali svaki uzorak vei od 30. Dakle, prema tome bi minimalni uzorak bio 30 opservacija (npr. podaci za razdoblje od 30 godina). Meutim, prilikom analize, to je analiza kompleksnija, to vam je vei uzorak potreban kako bi dobiveni rezultati bili to pouzdaniji. Primjerice, ukoliko radite viestruku regresiju, trebat ete vie podataka nego za jednostavnu linearnu regresiju. Takoer, bilo kakve dodatne manipulacije s podacima zahtijevat e veu seriju podataka. Box i Jenkins (1970) kao minimalni uzorak navode 50 opservacija.

Dakle, minimalni uzorak podrazumijeva 30 do 50 podataka, ovisno o kompleksnosti analize, no u svakom sluaju, ukoliko podaci postoje, nemojte se ograniavati. Vie podataka znai i kvalitetniju analizu.

2.2. Ogranienja podatakaOgranienja podataka se ponajprije odnose na nedostupnost podataka. Podaci se ili ne vode, ili ako postoje nisu dostupni javnosti. Ostala ogranienja se odnose na postojee podatke. Dakle, one serije podataka koje i postoje imaju taj problem da su kratke, vode se tek od 1995. godine. Broj opaanja je tada jako malen. Taj problem se moe rijeiti tako da umjesto godinjih podataka uzmemo mjesene ili kvartalne, pa automatski imamo vie opaanja. Ali to ne rjeava problem vremenskog horizonta jer se analiza i dalje odnosi samo na period od 1995. do 2011. godine to nije dugi rok i nikakva pravilnost iz tog se ne moe izvui. 2.3. Strukture podataka

U primijenjenoj ekonometriji analiza se, kao to smo vidjeli, provodi nad konkretnim podacima. Na radionici smo koristili podatke o varijablama u razliitim vremenskim razdobljima (godinama, kvartalima, mjesecima). No, to nije jedini nain na koji se analiza moe provesti. U nastavku navodimo najvanije strukture podataka koje susreemo u primijenjenoj ekonometriji.

1. VREMENSKE SERIJE (TIME-SERIES)Vremenskim serijama se koristimo u sklopu ove radionice. Ti podaci se sastoje od opservacija jedne ili vie varijabli kroz vrijeme. Dakle, podaci su ureeni kronoloki i mogu biti razliitih frekvencija (viegodinji, godinji, kvartalni, mjeseni, dnevni,). Vremensko razdoblje se obino oznaava slovom t, pa primjerice ukoliko promatramo BDP (Y) u nekoj zemlji u razdoblju od 1990. do 2002. godine, to emo oznaiti kao:Yt za t=1, 2,...,13gdje t=1 predstavlja 1990. godinu, a t=13 2002. godinu.Ova struktura podataka je najuobiajenija u makroekonometrijskim analizama.

2. PROSTORNI PODACI (CROSS-SECTION)Cross-section podaci daju opservacije o jednoj ili vie varijabli u jednom vremenskom trenutku/razdoblju (npr. za 2005. godinu) za veliki skup jedinica (npr. za razliite zemlje, regije, gradove, poduzea, kuanstva, pojedince i td.). U ekonometriji, cross-section varijable se obino oznaavaju sa slovom i, gdje i oznaava razliite (prostorne) jedinice za koje se varijabla promatra.Yi za npr. i=HR, SLO, CZ, UK, D, A, I, itd.Ova struktura podataka se najee koristi u mikroekonometrijskim analizama.

3. PANELPanel je zapravo miks prethodne dvije strukture podataka. Dakle, imamo podatke po razliitim prostornim jedinicama i kroz vie vremenskih razdoblja. Iz tog razdoblja se prilikom oznaavanja koristi i slovo t za oznaavanje vremenskog razdoblja i slovo i za oznaavanje prostorne jedinice na koju se podatak odnosi:Yit za t=1, 2,...,T & i=1,2,,N

3. PRIMJER i PODSJETNIK

Postoji li veza izmeu zaposlenosti i BDP-a u Hrvatskoj i koristimo podatke koje imamo na raspolaganju u ovom sluaju od 1967. do 2008.Prikaimo te podatke na jednom grafikonu (u excelu kako smo to radili na prethodnim radionicama):

Excel SCATTER PLOT tj. RASPRENI GRAFIKON

Gledajui ovaj grafikon, ini nam se kako postoji veza i to pozitivna veza izmeu ove dvije varijable: vea zaposlenost vei BDP. No, tu svoju pretpostavku moramo potvrditi ili opovrgnuti. Moramo provjeriti statistikim metodama da li je neka naa pretpostavka o tome kako su dvije ili vie varijabli meusobno povezane statistiki opravdana.Nakon to vidite kako grafiki izgleda odnos varijabli koje vas zanimaju, pretpostavljate odreeni funkcijski oblik te veze. Primjerice, moete pretpostaviti linearnu vezu izmeu te dvije varijable[footnoteRef:1]. Znai da pretpostavljamo da bi pravac dobro aproksimirao vezu izmeu ove dvije varijable: [1: Moete alternativno na temelju grafikog prikaza pretpostaviti da se radi zapravo o kvadratnom ili eksponencijalnom ili nekom drugom obliku veze, ali na ovoj radionici bavit emo se samo najjednostavnijom, linearnom vezom. Bitno je da znate da sami odluujete kako modelirati. ]

U Excelu kliknete na grafikon koji ste napravili Alati grafikona Izgled Crta trenda Vie mogunosti crte trenda Linearni trend PLUS na dnu oznaite *Prikai jednadbu & *Prikai R-kvadratnu vrijednost

Meutim, kao to vidimo, veina tokica (stvarnih podataka) se ne nalazi na ovom procijenjenom pravcu. to znai da kada bismo rekli da je veza izmeu ove dvije varijable u svakom trenutku t tono opisana ovim dobivenim pozitivno nagnutim pravcem, bili bismo neprecizni. Vi ste takoer mogli rei da recimo eksponencijalni trend to bolje opisuje, da je to dio parabole, itd, itd Dakle, ne postoji toan i netoan odgovor, postoji vae miljenje koje je utemeljeno na nekim argumentima.Mislim da bi linearni trend bolje opisivao zbog tog i tog

Ubacujui broj zaposlenih u odreenoj godini t vjerojatno emo dobiti vrijednost BDP-a koja se manje ili vie razlikuje od one vrijednosti koja je doista zabiljeena te godine. Npr. 1999. godine u Hrvatskoj je bilo 1143 tisue zaposlenih i ostvaren je realni BDP u vrijednosti 227.685,12 tisua kuna. Ukoliko 1143 ubacimo u jednadbu trenda, dobit emo realni BDP u iznosu 221.632,58 tisua kuna to oito ne odgovara stvarnosti. Dakle, grijeimo. Oito je kako emo prilikom procjene eljeti minimizirati greku, no odreena razina pogreke e svakako postojati. Stoga (linearnu) vezu koju elimo procijeniti zapisujemo na sljedei nain (uoite da je dodana greka relacije!):

gdje je zavisna varijabla (varijabla od interesa), nezavisna varijabla (varijabla za koju mislim da utjee na varijablu od interesa), a predstavlja greku relacije za godinu t[footnoteRef:2]. U ovom sluaju govorimo o JEDNOSTAVNOJ LINEARNOJ REGRESIJI[footnoteRef:3], jer pretpostavljamo i testiramo linearnu vezu izmeu samo dvije varijable. [2: Greka relacije se u literaturi alternativno oznaava i malim slovom u ili malim slovom e.] [3: O linearnoj regresiji e biti vie rije u nastavku, ovo slui kao uvod i podsjetnik na ono to ste ve radili u prijanjim radionicama i na Makroekonomiji.]

Ukoliko nas zanima linearna veza izmeu dvije ili vie nezavisnih varijabli (x) i jedne zavisne varijable (y), govorimo o VIESTRUKOJ LINEARNOJ REGRESIJI i zapisujemo:

gdje je zavisna varijabla (varijabla od interesa), , i td. su nezavisne varijable (sve ono to mislim da utjee na varijablu od interesa), a opet predstavlja greku relacije za godinu t.

to znae ovi 0, 1, 2, i td? Kako ih tumaimo/interpretiramo? Jednostavna linearna regresija 0 nam kae: Ukoliko je xt nula, oekuje se da e yt iznositi 0 jedinica (misli se na jedinice u kojima je izraen y). Ili alternativno: Ukoliko je xt nula, yt e u prosjeku iznositi 0 jedinica. 1 tumaimo na sljedei nain: Ukoliko se xt povea za jednu jedinicu (jedinicu u kojoj je izraen x), oekuje se da e se y promijeniti za 1 jedinica (jedinica u kojima je izraen y). Ili alternativno: Ukoliko se xt povea za jednu jedinicu, y e se u prosjeku promijeniti za 1 jedinica. Viestruka linearna regresija 0, Ukoliko su x1,t , x2,t itd. nula, oekuje se da e yt iznositi 0 jedinica. 1, Ukoliko se x1,t povea za jednu jedinicu, a x2,t ostane nepromijenjen, oekuje se da e se y promijeniti za 1 jedinica. 2, Ukoliko se x2,t povea za jednu jedinicu, a x1,t ostane nepromijenjen, oekuje se da e se y promijeniti za 2 jedinica.HINT: 0 se najee ne interpretira jer najee nema ekonomskog smisla.

Pazite na mjerne jedinice, da li su u apsolutnim vrijednostima, ili u %.OPI OBLIK INTERPRETACIJEAko je 1 pozitivan: ako se objasnidbena varijabla povea za jednu mjernu jedinicu, oekuje se da e se zavisna varijabla poveati za 1 mjernih jedinica,Ako je 1 negativan: ako se objasnidbena varijabla povea za jednu mjernu jedinicu, oekuje se da e se zavisna varijabla smanjiti za 1 mjernih jedinica.

Prilikom interpretacije 1 koeficijenta u pravilu morate obratiti pozornost na tri stvari: (1) predznak, (2) visinu koeficijenta (da li je reakcija snana ili nije) i (3) statistiku znaajnost koeficijenta.

Statistika znaajnostTo to smo dobili neke rezultate, neke vrijednosti za 0, 1, 2 i td. ne znai da smo gotovi s analizom i da se u te rezultate doista moemo pouzdati. Sjetite se onog grafikona s BDP-om i brojem zaposlenih. Mi smo i tamo pronali neki pravac, tzv. linearni trend, ali smo vidjeli kako se tokice (stvarni podaci) s tim pravcem ba i ne poklapaju. I iako metoda kojom je ovaj pravac dobiven (tzv. metoda najmanjih kvadrata, odnosno na engleskom Ordinary Least Squares tj. OLS) minimizira te greke, ta odstupanja, ona ih ne moe u potpunosti otkloniti. Iz tog razloga nas sada zanima kolike su te (minimalne) greke koje radimo? Jesu li prevelike? Moemo li usprkos tim grekama, znajui za njih, rei da svejedno ovaj pravac dobro aproksimira vezu izmeu promatranih varijabli[footnoteRef:4]? [4: Moda smo pogreno pretpostavili kako se radi o linearnoj vezi. Moda kada bismo pretpostavili i nacrtali eksponencijalni trend, moda bi se na njemu nalazilo vie tokica?]

Kako bismo odgovorili na ova pitanja, moramo testirati znaajnost tog pretpostavljenog (u ovom sluaju linearnog) modela. S tim testiranjima ste se ve susretali na Statistici i na Ekonometrijskim radionicama na Makroekonomiji, pa neemo ulaziti u detalje ve iskljuivo u ono to vam je praktino potrebno.Model testiramo na dva naina. Pritom, moramo biti svjesni da e odreena greka uvijek postojati kad god radimo sa stvarnim podacima. Stoga bismo odmah trebali odluiti koliku greku smo spremni tolerirati. 1%? 5%? 10%? (alfa, razina signifikantnosti odnosno pouzdanosti)TAKOER! PAZITE TO ZNAI 1%, 5%, 10%! Ako dobijete procijenjenu vrijednost recimo 20,5. To ne znai da ste vi 99% sigurni, a 1% ne, da ste u pravu. Jer ste 100% sigurni da ste procjenom dobili ba taj broj, greka relacije je ve u tom broju! Razina pouzdanosti od 1% znai, da kada biste 100 puta iz populacije odabirali uzorak, 99 puta bi dobili procijenjenu vrijednost od 20,5 , a samo jednom biste dobili drugu vrijednost.

STATISTIKA ZNAAJNOSTStatistiku znaajnost promatrate na temelju pokazatelja iz EViews tablice desno od koeficijenata i to Std. Error ili standardna pogreka, t-statistic ili t-statistika i trei (najjednostavniji ) Prob. ili p-vrijednost. Statistika znaajnost vam govori da li je procijenjeni koeficijent potreban u modelu. Ako je potreban, onda kaemo da je signifikantan. Nesignifikantni koeficijent moete si predoiti kao da je jednak nuli, nepotreban je.

Standardna pogreka vam govori koliko je veliko odstupanje meu podacima. Na temelju standardne pogreke se izraunava t-statistika 1/standardna pogreka=t-statistika. Za itanje t-statistike vam trebaju tablice da bi mogli odrediti je li koeficijent znaajan za model ili nije, ali okvirno pravilo je da bi t-statistika trebala biti vea od 1,82 u apsolutnoj vrijednosti. To je okvirna veliina za velike uzorke i 5% signifikantnosti. Drugim rijeima, testirate hipotezu:

H0: 1 NIJE signifikantan, tj. 1=0H1: 1 JE signifikantan, tj. 10

Ako je t-statistika vea od 1,82, tada ODBACUJETE H0 i smatrate 1 signifikantnim. U naem sluaju je t-statistika 56,8, pa ODBACUJEMO nultu hipotezu, tj. 1 je signifikantan.

UPOZORENJE! H0 moete ODBACITI ili je NE MOETE odbaciti. Tj. H0 NIKAD ne prihvaate!!!

Meutim, EViews vam nudi jo elegantniji nain odreivanja znaajnosti procijenjenih koeficijenata putem p-vrijednosti. Najjednostavnije reeno, p-vrijednost je VJEROJATNOST da je procijenjeni koeficijent =0. Ukoliko je takva vjerojatnost manja od dozvoljene, smatrate da je signifikantan (tj. odbacujete H0). Prvi korak: samostalno odaberete razinu signifikantnosti 1%, 5% ili 10%. Nakon toga usporeujete p-vrijednost s odabranom razinom. Ukoliko je p-vrijednost MANJA od odabrane razine signifikantnosti, tada je koeficijent signifikantan i obrnuto. Tj. ponovno testiramo dvije hipoteze:H0: 1 NIJE signifikantan, tj. 1=0H1: 1 JE signifikantan, tj. 10

Samostalno smo odabrali razinu signifikantnosti 5%, a p-vrijednost je 0,000 (vjerojatnost nikad nije 0, ve je toliko mala da se ne vidi na etiri decimale). Prema tome, vrlo je mala vjerojatnost da je =0, pa odbacujemo nultu hipotezu, tj. 1 je signifikantan. HINT: Da bi koeficijent bio signifikantan elite to VEU t-statistiku i to MANJU p-vrijednost!

1. Skupni F-test Provjeravamo signifikantnost/znaajnost svih varijabli u modelu odjednom. Testiramo nultu hipotezu koja nam kae da smo u potpunosti promaili model, odnosno da niti jedna nezavisna varijabla (x) nije znaajno povezana s nezavisnom varijablom (y) na opisani nain. One greke su prevelike. Tokice su predaleko od pravca, i to za svaku varijablu x povezanu s y-om. Dakle, pesimistino pretpostavljamo da nam taj pravac koji smo dobili toliko loe opisuje stvarnost, kao i da smo rekli da pretpostavljena veza uope ne postoji, odnosno: H0: 1=2=3==0 Testiranje ove pesimistine pretpostavke tj. hipoteze ste ve nauili u sklopu kolegija Statistika izraunavati i runo. U sklopu ove radionice, meutim, koristit emo se softverom koji e nam sam izraunati statistiku znaajnost pretpostavljenog modela. Ukoliko odbacimo H0, to znai da je barem jedna varijabla u modelu statistiki znaajna!

2. Pojedinani t-test Provjeravamo signifikantnost/znaajnost svake varijable (tonije parametra ) u modelu pojedinano. Testiramo nultu hipotezu koja nam kae da promatrana varijabla nije znaajna, odnosno da nam nije korisna u objanjavanju kretanja zavisne varijable. Dakle, H0 je opet pesimistina, pretpostavljamo da bi model bio barem jednako dobar kada te varijable u modelu ne bi niti bilo:H0: i=0 Statistiku znaajnost ste ve nauili raunati, a kasnije emo na primjerima objasniti kako ju iitati iz rezultata koje nam daje softver. Ukoliko ne uspijemo odbaciti H0, znai da varijabla u modelu nije znaajna, pa ju moemo izbaciti i provesti novu analizu bez nje (ili ju moemo pokuati zamijeniti s nekom drugom varijablom) Ukoliko odbacimo H0, to znai da je promatrana varijabla u modelu statistiki znaajna odnosno da moemo rei da veza izmeu nje i zavisne varijable postoji!

3. p-vrijednostUz svaki rezultat t testa i f testa, u e-viewsu e vam stajati i pripisana p vrijednost. Da i izbjegli tablice i usporeivanje teorijskog i emprijskog t-a, ili f-a, p vrijednost jednostavno usporeujete sa teorijskom razinom signifikantnosti (1%, 5%, 10%).

H0: varijabla nije znaajna p vrijednost > alfaH1: varijabla je znaajna p vrijednost < alfa

Ako dobijete npr. p vrijednost = 0,04tada moete zakljuiti: uz razinu pouzdanosti od 1%, alfa = 0.01, varijabla u modelu nije znaajna jer je p vrijednost (0.04) vea od razine pouzadnosti (0.01). uz razinu pouzadnosti od 5%, alfa=0.05, varijabla je u modelu znaajna (p vrijednost je manja od alfe).*ako je znaajna na razini pouzdanosti od 5%, onda je i od 10%.

Kriterij parsimonijeIako u model viestruke linearne regresije moete ukljuiti jako puno varijabli, prema kriteriju parsimonije model je bolji to je jednostavniji. To ste uspjeniji u svojoj analizi to uz manje nezavisnih varijabli (x) uspijete to bolje objasniti kretanje zavisne varijable (y)[footnoteRef:5]. [5: Dodavanjem svake nove varijable, gube se stupnjevi slobode i analiza i njezini rezultati su manje pouzdani. U sklopu ove radionice neemo detaljnije ulaziti u objanjavanje ovoga problema s kojim ste se uostalom detaljno upoznali na kolegiju Statistika.]

Kako ete znati koliko ste dobro objasnili kretanje zavisne varijable?

R-kvadrat i korigirani R-kvadrat R2 ili koeficijent determinacije mjeri postotak ukupne varijacije zavisne varijable (y) koji smo uspjeli objasniti s odabranim modelom. R2 poprima vrijednost izmeu 0 i 1, pri emu 0 znai kako model koji smo konstruirali objanjava 0% stvarnog kretanja zavisne varijable (odnosno uope ga ne moe objasniti, varijable su u potpunosti nepovezane). Ukoliko je R2=1, to znai da je modelom u potpunosti objanjeno kretanje y.

Naravno, to vie varijabli ubacujete u model, to e vei postotak varijacija y biti objanjen modelom. Ali, postoji jedan problem! Usporedba R2-a razliitih modela s vie ili manje jednadbi nije mogua, budui se dodavanjem dodatnih varijabli gube stupnjevi slobode i model je sve nekvalitetniji. Zato se prilikom analize i usporedbe razliitih modela uglavnom promatra tzv. korigirani R2 odnosno korigirani koeficijent determinacije. On uzima u obzir taj gubitak stupnjeva slobode te kanjava model s vie varijabli, dajui realniju sliku kvalitete modela te omoguava usporedbe razliitih modela.

Interpretacija koeficijenataKvaliteta modelaVisina koeficijenataPredznak koeficijenataStatistika znaajnost (t-statistika ili p-vrijednost)R2 za jednostavnu regresijuR2 za viestruku regresiju Procijenjeni model

4. E-VIEWS

4.1. UNOS PODATAKA

Podaci se najee prikupljaju u Excel tablicama, pa ih je potrebno uitati u EViews. EViews 7 nudi vie naina uitavanja podataka, a ovdje e biti objanjen samo jedan. Za ostale naine uitavanja podataka, moete pogledati u Users Guide I (u izborniku Help) na stranici 13.

Da biste zapoeli s radom u EViews-u morate otvoriti novi workfile. Otvara se na uobiajen nain: FileNewWorkfile (ili Ctrl+N). Otvara se novi prozor:

Program vas pita dvije vane stvari: kakva je struktura vaih podataka (Workfile structure type) te koliko imate promatranja (Data specification). Ukoliko imate vremenske serije, tada u izborniku s desne strane odaberete frekvenciju te period kada vam podaci poinju i kada zavravaju. U primjeru gore koristimo kvartalne podatke koji poinju u prvom kvartalu 2000. (2000 q1), a zavravaju u etvrtom kvartalu 2011. (2011 q4). Kliknete OK.

Kreirali ste novi, prazan workfile. Sada elite uitati podatke. FileImportIMPORT FROM FILE. Nakon to pronaete Excel tablicu s podacima otvori vam se novi prozor. HINT: Excel mora biti zatvoren, naziv tablice ne smije sadravati hrvatska slova, a podrani format je samo .xls (stari format)

Dva puta kliknete dalje (next) i u zadnjem koraku upiete kada imate prvu observaciju, u naem sluaju je to prvi kvartal 2000.

Kad kliknete na FINISH, gotovi ste s unosom podataka.

Va radni prozor (Workfile) sada izgleda ovako:

Serije podataka(Jednadbe koje procijenite se takoer ovdje nalaze, a njihov prozori je plave boje, ne ute)Workfile, ovdje se nalaze sve vae serije i izraunicommand windowpadajui izborniciSvaku analizu zapoinjete DESKRIPTIVNOM STATISTIKOM. To znai da prvo morate grafiki prikazati vae serije podataka i ocijeniti koji ete uope model raditi. VRLO VANO! EViews ima dva rezervirana naziva varijabli, a to su c za konstantu i resid za reziduale (odstupanja odnosno greke). Prema tome, NE MOETE nazvati niti jednu svoju varijablu c ili resid. Iz tog razloga, osobna potronja je u EViews uvezena pod nazivom potr, a ne C kao to je uobiajeno u makroekonomiji.

4.2. DESKRIPTIVNA STATISTIKA

Svaka ekonometrijska analiza zapoinje upravo s grafikom i deskriptivnom analizom prikupljenih podataka. Naime, od izuzetne je vanosti upoznati podatke s kojima raspolaete, a grafika analiza vam omoguava da ocijenite to biste trebali napraviti s podacima (kako ih transformirati), ali isto tako i kojom metodom (modelom) provesti istraivanja. Odabir pravog modela je kljuan, a modela je mnogo (vjerujte, linearna regresija je tek poetak ). Serije podataka analizirate na nain da otvorite eljenu seriju, npr. BDP, te pod izbornikom View moete birati alate koji vam trebaju. Izbornik View je moda i najvaniji izbornik u EViewsu. U njemu se nalaze opcije za grafiki prikaz (graph) te za deskriptivnu analizu. Odabirom Graph nude vam se razliite mogunosti grafikog prikaza, dok Descriptive Statistics & Tests nude razliite mogunosti deskriptivne statistike analize s kojom ste ve upoznati.

Ukoliko elite analizirati nekoliko serija zajedno, tada morate napraviti grupu. Selektirate nekoliko serija koje elite (drei tipku Ctrl) i pritisnete Enter. (ILI, oznaite sa Ctrl sve serije koje elite imati na grafu, desni klik miem, open, as group). Dobili ste grupu koja sadrava dvije ili vie serija podataka. Pod izbornikom View ponovno imate nekoliko interesantnih opcija izdvojit emo Graph, Descriptive statistics i Covariance analysis. Budui da sada imate dvije serije podataka, grafiki moete prikazati linijske grafikone, ali i grafikone rasipanja koji su izuzetno korisni (vidi sliku dolje)

VIEW GRAPHA) Ako odaberete linijski

B) Ako odaberete npr. BOX-PLOT

Sve to ste prije runo raunali i crtali, sad je dostupno na klik. Moete odabrati bilo koju vrstu grafa. Ali pazite, ne uite napamet, iza svakog klika, mora stajati razumijevanje! HINT! Grafikone moete dobiti vrlo brzo tako da u command window upiete naredbu plot naziv_varijable1 naziv_varijable2 ... (linijski grafikoni) ili scat naziv_varijable1 naziv_varijable2 (grafikon rasipanja)

VIEW Descriptive statisticsAko pak odaberete ovo, dobit ete izraun aritmetike sredine, standardne devijacije, moda i slino, za sve varijable koje vas zanimaju.

VIEW Covariance analysis Covariance analysis ili analiza kovarijance vam omoguava da analizirate povezanost meu podacima pomou matrice korelacije.

Prvi okvir Statistics vam omoguava da odaberete to elite analizirati kovarijancu, korelaciju, te elite li testirati znaajnost dobivenih pokazatelja pomou t-statistike i p-vrijednosti (Probability).

HINT! Za brzu analizu korelacije meu varijablama moete u command window upisati naredbu cor naziv_varijable1 naziv_varijable2 ...

Ako se ponovno vratimo na grafiki prikaz, ono to moemo uoiti je da li serije sadre ili ne sezonu. npr. ako istraujete promet u duanu s djejim igrakama, za oekivati je da e u 12.mjesecu prodaja porasti jer je tada Boi i roditelji kupuju djeci igrake, takoer se isto moe pretpostaviti za recimo vrijeme kolskih praznika. Seriju u pravilu treba oistiti od sezonskih karakteristika da rezultat bude to toniji, te da ne doe do pojave prividne regresije (prividna regresija je objanjena dalje u biljekama). Takoer, kasnije emo raditi i problem nestacionarnosti koji se ispituje UNIT ROOT TESTOM, ali to u narednim radionicama.Zato, prije bilokoje analize, potrebno je serije podataka DESEZONIRATI. Inae program koji se bavi samo desezoniranjem se zove DEMETRA i besplatan je na netu.

U e-viewsu to moete napraviti tako da kliknete na seriju, PROC SEASONAL ADJUSTMENT ODABERETE METODU.Pogledajmo sada dobiveno:

Indeks _sa oznaava desezonirane serije, i vidimo da je sezona uklonjena.Takoer, ako neka serija ima iljke, npr. nagli pad ili nagli skok, u analizi se to ne smije zanemariti. Treba se razmisliti o uvoenju DUMMY varijable, ili o izbacivanju tog podatka (outlier).

Sada kada smo gotovi sa diferencijalnom statistikom, kreemo na inferencijalnu, te na metodu jednostavne linearne regresije. No prije inferencijalne statistike, u nastavku su dani korisne upute za program e-views.

4.3. Transformacije i matematike operacije s podacima

EViews nudi mnotvo mogunosti za transformiranje podataka s kojima radite. Sve transformacije se provode pomou naredbe genr. Nekoliko korisnih naredbi: prve diferencije podataka: genr naziv_nove_varijable=d(postojea_varijabla) prirodni logaritam: genr naziv_nove_varijable=log(postojea_varijabla) prve diferencije logaritmiranih podataka (tzv. logdiferenciranje): genr naziv_nove_varijable=dlog(postojea_varijabla) vremenski pomak: genr naziv_nove_varijable=postojea_varijabla(-1) nova varijabla je pomaknuta u nazad za jedno razdoblje, ako elite pomaknuti u naprijed za dva razdoblja onda nakon naziva varijable stavite (2) matematike operacije se provode standardno: genr naziv_nove_varijable=x+y nova varijabla je zbroj x i y

4.4. Hodrick-Prescott filter

Hodrick-Prescott filter (HP filter) je metoda za izraun trenda iz serije podataka. Vremenske serije se obino sastoje od nekoliko komponenti, odnosno:

pri emu je T trend, S je sezonska komponenta, C je ciklika komponenta, dok je sluajna (stohastika) komponenta. U analizi esto elite promatrati samo jedan dio, primjerice elite ukloniti sezonsku komponentu (vidi dio o desezoniranju) ili u ovome sluaju elite izolirati samo trend.

Tehniki gledano, HP filter uklanja cikliku komponentu iz vremenske serije s uestalou viom od 32 kvartala ostavljajui samo trend vrijednost, pri emu se unaprijed odabire parametar izglaivanja, popularni . to je vei, to je trend izglaeniji. Prema tome, odabir =0 u potpunosti replicira promatranu vremensku seriju, dok = pretvara HP filter u jednostavni linearni trend. U praksi se najee koristi vrijednost 100 za godinje podatke, 1.600 za kvartalne i 14.400 za mjesene.

U EViewsu HP filter raunate na nain da otvorite eljenu seriju podataka i odaberete ProcHodrick-Prescott filter nakon ega moete birati naziv trenda i ciklike komponente te odabrati vrijednost parametra . Ciklika komponenta se dobiva kao razlika izmeu stvarnih podataka i pripadajueg trenda (odstupanje od trenda).5. INFERENCIJALNA STATISTIKA

DEFINICIJAInferencijalna statistika je skup statistikih metoda kojima se na osnovi prikupljenih mjerenja ili opaanja donose zakljuci o populaciji, tj. procjenjuju se nepoznati parametri populacije i testiraju statistike hipoteze. Skup podataka (dakle svi mogui podaci) opisuje DISTRIBUCIJA VJEROJATNOSTI (to se pretpostavlja u inferencijalnoj statistici), a svojstva te distribucije je mogue opisati pomou nepoznatih parametara (aritmetika sredina, varijanca itd). Raspoloivi podaci ine podskup populacije koji se naziva uzorak. uzima se SLUAJAN UZORAK (sluajni izbor je izbor kod kojeg se jedinice biraju neovisno jedna o drugoj). sluajan uzorak osigurava reprezentativnost i omoguava primjenu teorije vjerojatnosti (odstupanje vrijednosti izraunatih iz uzorka od odgovarajueg parametra populacije kree se u odgovarajuim granicama sluajnih varijacija izbora).5.1. PARAMETAR I PROCJENITELJ

*nije isto! (razlikovati!)

Ako se procjenjuje nepoznati parametar (npr. aritmetika sredina populacije ili varijanca ) na temelju uzorka, tada se sluajna varijabla , kojom se taj parametar procjenjuje naziva procjenitelj (estimator) parametra . (Parametar nema kapicu, procjenitelj ima)

Kao i svaka sluajna varijabla, tako i procjenitelj ima svoju distribuciju vjerojatnosti koja se naziva sampling distribucija. Na temelju te distribucije dobiva se ili procjena brojem ili intervalna procjena parametra . Sampling distribucija je teorijska distribucija vjerojatnosti procjenitelja parametara, zato je procjenitelj sampling varijabla (mijenja se od uzorka do uzorka).5.2. SVOJSTVA PROCJENITELJA

Poeljno je da procjenitelj nepoznatog parametra ima odreena svojstva.

, procjenitelj (procjena brojem)

procjenitelj (intervalna procjena)Traena svojstva mogu se grupirati na: svojstva malog uzorka (svojstva konanog uzorka) asimptotska svojstva (svojstva velikog uzorka)Svojstva malog uzorka su nepristranost i efikasnost, a asimptotska svojstva su asimptotska nepristranost i konzistentnost. 1. NEPRISTRANOST2. EFIKASNOST3. KONZISTENTNOST NEPRISTRANOST

Procjenitelj je nepristran procjenitelj parametra ako je:

(ovo E itajte oekivana vrijednost, u zagradi pie ega dakle oekivana vrijednost procjene treba biti jednaka stvarnoj vrijednosti). TAKOER, oekivana vrijednost, kao da kaete, procjena U PROSJEKU. Ne izostavljajte ovo oekivano ili u prosjeku.

Dakle, u grubo reeno, svojstvo nepristranosti znai da ak i u malim uzorcima procjene parametara u prosjeku jednake stvarnim vrijednostima. Naime, ako bi se vrijednost parametra izraunala za svaki uzorak i postupak ponavljalo beskonano mnogo puta, prosjena vrijednost svih izraunatih procjena bila bi jednaka stvarnoj vrijednosti parametra .

Premda je nepristranost poeljno svojstvo, ponekad e se preferirati pristrani procjenitelj s malom varijacom pred nepristranim procjeniteljem s velikom varijancom. EFIKASNOSTEfikasnost je svojstvo procjenitelja vezano uz varijancu. Nepristran procjenitelj je efikasan samo i ako samo u skupu svih nepristranih procjenitelja ima najmanju varijancu MVUE (Minimum Variance Unbiased Estimator).*Najbolji LINEARNI nepristrani procjenitelj BLUE (Best Linear Unbiased Estimator) DOBIVEN METODOM NAJMANJIH KVADRATA! (o metodama e kasnije biti rije).

KONZISTENTNOST

Procjenitelj je konzistentan procjenitelj parametra ako se s poveanjem uzorka procijenjena vrijednost pribliava stvarnoj vrijednosti parametra . 6. MODEL JEDNOSTAVNE LINEARNE REGRESIJERegresijska analiza je najee koritena metodologija u ekonometriji. Opisuje ovisnost jedne varijable (y) o jednoj ili vie drugih varijabli (x1, x2, x3).Varijabla od interesa (y) naziva se zavisna varijabla (regresand, endogena ili output varijabla), a varijable (x) s kojima se objanjavaju varijacije zavisne varijable nazivaju se nezavisne varijable (regresorske varijable, egzogena ili input varijabla). Modelom jednostavne linearne regresije izraena je stohastika linearna veza izmeu zavisne varijable y i nezavisne varijable x.

Ovi modeli su LINEARNI, jer su linearni u parametrima. Linearnost se odnosi na nain na koji se parametri i greke relacije pojavljuju u regresijskoj jednadbi, a ne na odnos meu varijablama.

S druge strane, model je nelinearni: . Ako se model (poput ovog) moe logaritamskom transformacijom svesti na linearni, onda je rije o log linearnom modelu.6.1. POLAZNE PRETPOSTAVKE U ANALIZI MODELA JEDNOSTAVNE LINARNE REGRESIJE

1. Veza izmeu x i y je linearna.2. Varijabla x je deterministika varijabla3. Greke relacije (- to je sluajna varijabla, stohastika) u prosjeku ne utjeu na zavisnu varijablu

OEKIVANAVRIJEDNOST OD GREAKA RELACIJE JE 0!4. Bilo koje dvije sluajne varijable su meusobno nezavisne, a time i nekorelirane.

odstupanja nisu meusobno povezana (serijski korelirana), ako jesu problem autokorelacije.5. su normalno distribuirane sluajne varijable s jednakom varijancom.Gaussova distribucija Rezidualna odstupanja su normalno distribuirana.

*Uoite da se prve dvije pretpostavke odnose na parametre x i y, dok se ostale 3 odnose na greke relacije.Jednom kad procijenite va model, potrebno je provjeriti da li vrijede sve pretpostavke. Odnosno, provjeravate ADEKVATNOST MODELA. 6.2. NARUAVANJE PRETPOSTAVKI

1. MULTIKOLINEARNOST REGRESORSKIH VARIJABLI2. HETEROSKEDASTINOST (problem promjenjivosti varijance)3. AUTOKORELACIJA GREAKA RELACIJE4. NENORMALNOST GREAKA RELACIJEUoite da se prva odnosi na varijable, a ostale 3 na greke relacije!6.2.1. MULTIKOLINEARNOST REGRESORSKIH VARIJABLI

Problem multikolinearnosti je prisutan ako barem dvije regresorske varijable linearno zavisne ili priblino linearno zavisne. Posljedica: SE (standard error) procjenitelja jako velika (raste), to znai da e t vrijednost biti mala, to e navoditi na zakljuak da su pojedine regresorske varijable nesignifikantne, te da ih treba iskljuiti iz modela, a moda su u biti signifikantne, ali zbog multikolinearnosti ispada da nisu. Takoer, zbog velikih standardnih pogreaka intervalne procjene parametara biti e vrlo neprecizne.

Neki pokazatelji multikolinearnosti:Najjednostavniji nain utvrivanja ozbiljnog problema multikolinearnosti je da se ispitaju standardne pogreke procijenjenih parametara.Meu standardnim pokazateljima multikolinearnosti u programskim paketima su faktor inflacije varijance VIF (Variance Inflation Factor) ili ekvivalentni pokazatelj TOL (Tolerance) definirani izrazom:

Ozbiljan problem multikolinearnosti je prisutan ako je:

odnosnoVIF>5 ili TOL < 0.2.Rjeavanje: poveanje broja podataka, jer je multikolinearnost problem uzorka, ne populacije preko transformacije varijabli iskljuivanjem iz modela jedne ili vie regresorskih varijabli, ali taj problem moe uzrokovati specifikacijsku pogreku u modelu.PRIMJER:

Procijenite gore zapisanu jednadbu (podaci su poslani na mail).E VIEWS NAREDBA: QUICK ESTIMATE EQUATIONili ako ete pisati naredbu: LS INV_SA C CON_SA BDP_SA DAKLE napiete LS kao naredbu za procjenu metodom najmanjih kvadrata, a nakon tog ispiete imena varijabli, s tim da je prva uvijek zavisna varijabla, a c oznaava konstantu.HINT!EViews osim padajuih izbornika ima i tzv. command window u kojega moete upisivati naredbe direktno, bez klikanja po izbornicima. Ovaj se nain u pravilu preferira, jer je mnogo bri. U poetku je uvijek teko se naviknuti na taj nain rada, meutim ukoliko ete raditi intenzivnije u EViewsu, vrlo brzo ete se naviknuti. Primjerice, za procjenu ove jednadbe u command window bi upisali: ls inv_sa c con_sa bdp_sapri emu je ls oznaka za least squares ili najmanje kvadrate (naredba za linearnu regresiju)

Procjenom se dobije:

PAZITE!! Gore dobiven R kvadrat se ne ubacuje u VIF formulu! To je jedna od najeih pogreaka!R kvadrat u VIF formuli nije R kvadrat iz originalne jednadbe, ve trebate svaku nezavisnu varijablu regresirati jednu na drugu.Pomone regresije:

Ako je R kvadrat dobiven iz pomonih regresija velikproblem multikolinearnosti!

j broj nezavisnih varijabli

E-VIEWS naredba: VIEW COEFFICIENT DIAGNOSTICS VARIANCE INFLATION FACTORS

Napomena: E-VIEWS sam odvoji jednadbe, na onu prvu procijenjenu jednadbu, radite naredbu.

Centrirani VIF gledate (odgovara formuli).VIF>5 problem multikolinearnosti u obje varijable.6.2.2. HETEROSKEDASTINOST (problem promjenjivosti varijance)

Problem heteroskedastinosti prisutan je kad je naruena pretpostavka o nepromjenjivosti varijance sluajnih varijabli u linearnom regresijskom modelu (nejednaka varijanca sluajnih varijabli).Procjenitelji parametara metodom najmanjih kvadrata su i u sluaju promjenjivosti varijance nepristrani i konzistentni, ali vie nisu efikasni jer je narueno svojstvo najmanje varijance. Ne mogu se provoditi t i F testovi.Otkrivanje heteroskedastinosti grafikim putem (preko dijagrama rasipanja na kojima se kao varijable odabiru kvadrirani reziduali i zavisna, odnosno nezavisne varijable. Heteroskedastinost je prisutna ako se kvadrati reziduala na bilo koji nain sustavno mijenjaju ovisno o vrijednostima pojedine varijable ukljuene u model). postupcima testiranjaA. Goldfield-Quandtov test HO: varijanca je homoskedastina (nepromijenjiva)H1: varijanca je heteroskedastina (promijenjiva)B. LM-testovi HO: varijanca je homoskedastina (nepromijenjiva)H1: varijanca je heteroskedastina (promijenjiva)I. Breusch-Paganov LM-testII. Whiteov test (LM-test) najee koriten!Kako to izgleda u e-viewsu?Kad procijenite jednadbu (kako smo ve nauili) dobijete:

Da bi ispitali postoji li heteroskedastinost idete na viewresidual diagnostics heteroskedasticity test

I dobijete sljedee:

Kao to ve vidite, ovdje vas pita koji test elite upotrijebiti. Ako odaberete Whiteov test dobit ete sljedei ispis (moete odabrati koji elite):

Ponovno gledate p-vrijednost i provodite test na uobiajen nain. Uz razinu pouzdanosti od 10% moemo rei da vrijedi H0 hipoteza, te da nema heteroskedastinosti, no uz razinu pouzdanosti od 5% ima. Za vjebu, provjerite rezultat i sa ostalim testovima.Uklanjanje heteroskedastinostiWhiteova korekcija, Newey-Westova korekcija.

6.2.3. AUTOKORELACIJA GREAKA RELACIJE

U modelu viestruke linearne regresije se pretpostavlja da su sluajne varijable (greke relacije) meusobno nezavisne i identino distribuirane normalne sluajne varijable. Ako pretpostavka o nezavisnosti sluajnih varijabli nije ispunjena, javlja se problem autokorelacije. Uzrok autokorelacije greaka relacije moe biti razliiti. Npr. pogrena specifikacija modela, pogrena specifikacija svojstava sluajnih varijabli, transformacije izvornih vrijednosti varijabli izraenih u obliku vremenskih nizova. Problem autokorelacije se moe uoiti na temelju dijagrama rasipanja ili korelograma (grafiki prikaz autokorelacijske funkcije) rezidualnih odstupanja.

DURBIN-WATSON TEST (DW TEST) Ispituje se postoji li problem autokorelacije prvog reda (susjedne greke vezane) S obzirom da u naem primjeru imamo kvartalne podatke, vrlo vjerojatno e biti rije o autokorelaciji 4 reda (ako je bude bilo).

HO: nema autokorelacijeH1: ima autokorelacije prvog reda

DW test veliina: Ako su greke relacije autokorelirane, vrijedi:

(ro) moe poprimiti vrijednosti od -1, 0, 1. savrena negativna autokorelacija (savreno korelirane greke relacije) DW=4

nema autokorelacije, greke nisu korelirane, greka relacije je isti sluajni proces DW=2

savrena pozitivna autokorelacija (savreno korelirane greke relacije) DW=0

Test na gornju granicu negativnu autokorelaciju ispitujemo (inae tu svi najvie grijee).du i dL su kritine vrijednosti, koje se iitaju iz tablice (za neku razinu signifikantnosti alfa, veliinu uzorka n i broj regresorskih varijabli k).DW u E-viewsu se moe iitati dolje u tablici:

Oito postoji problem jer je DW veliina razliita od 2.BITNA NAPOMENA:DW-test se ne moe primijeniti: na autoregresijski model, tj. model u kojem se kao regresorska varijabla pojavljuje zavisna varijabla s pomakom u vremenu na model u kojem su vrijednosti varijabli diferencirane, u sluaju kada su regresorske varijable stohastike. Autokorelacija vieg reda1. moete koristiti autokorelacijsku funckiju (AC) i parcijalnu autokorelaciju (PAC), te izraunate Ljung-Boxove Q-test veliine.H0: nema autokorelacije do reda kH1: ima autokorelacije k-tog redaU e-viewsu ponovno u prozoru gdje je procjenjena jednadba, odete na VIEWRESIDUAL DIAGNOSTICS CORRELOGRAM Q-statistics

Kad to ukljuite pitat e vas koliko pomaka elite, odnosno do kojeg reda testirate autokorelaciju. Stavite 20.

Dobijete sljedee:

Pogledajte p vrijednosti, sve su 0.0000, dakle, prihvaate uz sve uobiajene razine signifikantnosti H1 hipotezu koja kae da postoji autokorelacija. Ako vidite na grafu ove crtice, one oznaavaju granice unutar kojih e va sigma biti nula, dakle, ako se ovi iljci nalaze unutar tih granica, to znai da procjene koeficijenata autokorelacije ne odstupaju znaajno od nule. Na naem primjeru moemo vidjeti da prvi i drugi lan izlaze iz tih granica, to upuuje na to da vjerojatno postoji autokorelacija prvog ili drugog reda, a ak je sumnjiv i 7 i 8 pomak ako pogledate graf.2. BREUSCH-GODFREYEV TESTOsim to smo koristili korelogram da vidimo postoji li problem autokorelacije vieg reda, moemo provesti i LM test.VIEW REZIDUAL DIAGNOSTICS SERIAL CORRELATION LM TEST

Ponovno vas pita koliko pomaka elite. Stavite 8 jer nam je gore bio sumnjiv 8 pomak takoer.

Ponovno pogledajte p vrijednosti kod pomaka! RESID(-1), RESID(-2) itd. to moete uoiti? Samo u prvom pomaku moete prihvatiti H0. A ostalo?Uklanjanje autokorelacije transformacija varijabli (npr. diferenciranje u poglavljima prije je opisano kako diferencirate varijable u e-viewsu) ako je rije o autokorelaciji prvog reda dodati AR lan u model (o tom vie drugom prilikom)6.2.4. NENORMALNOST GREAKA RELACIJE

Normalna distribucija greaka relacije nije nuna u postupku procjene parametara, no nuna je pri testiranju hipoteza i izraunavanju intervalnih procjena parametara. Ako nije ispunjena pretpostavka o normalnosti, procjene parametara metodom najmanjih kvadrata i dalje su najbolje nepristrane procjene, no t-test, F-test i Hi-kvadrat test vie nisu pouzdani.

Pretpostavka o normalnosti greaka relacije se moe ispitati pomou Jarque-Beraovog testa. Za normalnu je distribuciju koeficijent asimetrije , a koeficijent zaobljenosti . Jarque-Bera testom, koji koristi koeficijent asimetrije i koeficijent zaobljenosti reziduala procijenjenih metodom najmanjih kvadrata, ispituje se odstupaju li procijenjene veliine znaajno od vrijednosti tih mjera za normalnu distribuciju. H0: greke relacije su normalno distribuiraneH1: greke relacije nisu normalno distribuirane

U e-viewsu ponovno idete na viewresidual diagnostics Histogram Normality test

Dobijete sljedee:

Ponovno kao i do sada, gledate p vrijednost koja je pripisana test veliini, u ovom sluaju Jargue-Bera. P vrijednost iznosi 0.203706 i vea je od svih uobiajenih razina pouzdanosti (1%, 5%, 10%), to znai da prihvaate Ho hipotezu. normalna je. (?) Ali moete vidjeti da je pomaknuta u desno kako sad to? *pomaknut grafikon mogue zbog outliera (reziduali su u pitanju)*pazite: ovaj test je asimptotski to znai da vrijedi na to veem uzorku, zato imate malo pomaknutu distribuciju. 7. PRIVIDNA REGRESIJA

Potrebno je dotaknuti se problema prividne regresije. Naime, jednom kada se upoznate s provoenjem ove vrste analize, moete se samostalno upustiti u analize svih vrsta. Tonije, moete istraivati povezanost bilo kakvih pojava. Ovu analizu moete primijeniti na marketing (da li je vie reklama na radiju povezano s veom prodajom), na turizam (da li je vie sunanih dana u godini povezano s veim brojem turista), na industriju (je su li vee izvozne subvencije povezane s veom industrijskom proizvodnjom) itd. Jednom kada nauite provoditi analizu, moi ete analizirati skoro sve to vam padne napamet. Meutim, morate pritom biti svjesni jedne opasnosti, a to je prividna regresija.

Naime, prividna regresija znai ono to joj govori i ime: moete analizom dobiti da veza postoji iako je zapravo nema. Kako? Evo par primjera. Mogue je da dvije varijable koje promatrate zapravo nemaju nikakve veze, ali obje imaju sezonsko kretanje pa podaci to zabiljee i kao rezultat dobijete vezu koja zapravo ne postoji (primjerice prodaja sladoleda i dozrijevanje lubenica oboje je najintenzivnije u ljeto te stoga moete dobiti pozitivnu vezu, ali ne znai da su stvarno dvije varijable meusobno izravno povezane). Ukoliko neke dvije varijable imaju slian trend, tada se javlja problem prividne regresije upravo zbog trenda. Takvi podaci se u ekonometrijskim analizama obino nazivaju nestacionarnim podacima. Primjerice, ukoliko uzmete podatke o BDP-u i broju internetskih prikljuaka dobit ete dvije serije podataka koje imaju pozitivan trend. Regresijska analiza moe pokazati izrazitu povezanost, koja meutim ne mora biti rezultat kauzalnosti (uzronosti) meu varijablama, ve jednostavno slinih trendova. Prividna regresija se moe pojaviti i u sluaju kada postoji posredna povezanost izmeu dviju varijabli, tj. C utjee i na A i na B. Ako u regresijskoj analizi promatrate samo varijable A i B, dobit ete prividnu regresiju, jer niste ukljuili varijablu C. Primjerice, raene su analize o broju sveenika i broju prostitutki u naseljenim mjestima. Analiza je pokazala pozitivnu vezu. Meutim, pitanje je da li broj sveenika utjee na broj prostitutki (vjerojatno NE) ili u veim mjestima ima vie stanovnika, pa jednako tako i vie sveenika i vie prostitutki (Veliina mjesta je varijabla C).Iz tog razloga, kada provodite ekonometrijske analize, neophodno je analizu temeljiti na nekoj postojeoj ekonomskoj teoriji koju ete pritom provjeriti za odreenu zemlju ili podruje.

8. DODATAK: Jednostavna i viestruka linearna regresija u Excelu uz dodatak PHStatJednostavnu i viestruku linearnu regresiju mogue je provesti i u Excelu, samo je prethodno potrebno instalirati dodatak koji se zove PHStat2.

Kako provesti analizu u Excelu prikazat emo na temelju podataka o komponentama BDP-a.

Nakon kopiranja tablice u novi Excel dokument, uklonili smo podatke koji nam za konkretnu analizu nisu potrebni te ostavili iskljuivo podatke o BDP-u, osobnoj potronji, investicijama, dravnoj potronji, uvozu i izvozu. Kako bismo poeli s naom analizom, kliknemo u alatnoj traci na Dodaci te odaberemo PHStat.

Kada odaberete PHStat, na padajuem izborniku odabirete Regresija (Regression) te moete odabrati Jednostavnu linearnu regresiju (Simple Linear Regression) ili Viestruku regresiju (Multiple Regression)Budui emo za primjer napraviti model viestruke linearne regresije, odaberite Multiple Regression.

Kada ste odabrali Multiple regression, oznaavate zavisnu i nezavisne varijable:Zavisna varijabla - Y

Nezavisne varijable potr, G, I, X, IM

Potom oznaavate koje rezultate elite da Excel izbaci. Za trenutne potrebe dovoljno je oznaiti samo Regression Statistics Table, ANOVA and Coefficients Table i Residuals Table.

I kliknete OK.Rezultati e se pojaviti na posebnom listu:

Tu ete pronai koeficijente, podatke o njihovoj pojedinanoj statistikoj znaajnosti (pojedinani t-test) te skupnoj znaajnosti (skupni F-test), kao i informaciju o (korigiranom) R-kvadratu.

P-vrijednost za pojedinani t-testP-vrijednost za skupni F-testI sada moete analizirati kako smo nauili

9. P.S.

P.S. U svoj CV sada moete dodati da se znate koristiti E-viewsom 7 i PHStatom.

P.P.S. Ako vam neki izrazi nisu jasni, ili postupci, slobodno se javite na e-mail, ili doite na konzultacije jer su temelji najbitnija stvar, ostalo onda ide samo od sebe.

17