Upload
buingoc
View
218
Download
0
Embed Size (px)
Citation preview
Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten
Statistische Grundbegriffe
• Merkmalstrager (Beobachtungseinheit)
o Individuen, Haushalte, Unternehmen, Lander
• Merkmal (Variable)
o Alter, Einkommen, Gewinn, BIP
• Merkmalsauspragung (Wert der Variable)
o 25 Jahre, 50.000 e im Jahr, 4 Mrd. e im Jahr, 551 Mrd. e im 4.Quartal 2003
1
Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten
Datenarten: Skalierungsniveau
• Nominalskala: Ist A verschieden von B?
o Auspragungen konnen lediglich unterschieden werden(Beispiel: Kaufentscheidung modelliert mit Hilfe von Dummyvariable:Kauf = 1 und kein Kauf = 0)
• Ordinalskala (Rangskala): Ist A großer als B?
o Auspragungen konnen zusatzlich auch in eine Rangordnung gebrachtwerden (Beispiel: Kundenzufriedenheit)
2
Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten
Datenarten: Skalierungsniveau
• Kardinalskala
o Ausmaß der Unterschiede kann angegeben und interpretiert werdeno Intervallskala: Um wieviel differieren A und B?
Abstande konnen verglichen werden (Beispiel: Temperaturdifferenz,aber 0 Grad Celsius bedeutet nicht ,,keine Temperatur”)
o Verhaltnisskala: Um das wie vielfache ist A großer als B?zusatzlich naturlicher Nullpunkt (Beispiele: Preis, Lange, Gewicht)
3
Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten
Datenarten
• Diskrete vs. stetige Merkmale
o Diskret: nominalskalierte Merkmale sowie alle Merkmale, denen einZahlvorgang zugrunde liegt (Beispiel: Besucherzahl)
o Stetig: beliebig genauer (fiktiver) Messvorgang(Beispiele: Korpergroße, Gewinn)
• Aggregationsebene
o Gesamtwirtschaftlich/Makrodaten (Beispiele: BIP, Inflation)o Individualdaten/ Mikrodaten (Beispiele: Lohn eines Arbeitnehmer,
Produktpreis)
4
Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten
Datenarten: Querschnitts- und Zeitreihendaten
• Querschnittsdaten
o Daten bzgl. verschiedener Einheiten (Beispiele: Individuen, Haushalte,Firmen) zu einem gegebenen Zeitpunkt
o Haufig: Annahme einer Zufallsstichprobe/Unabhangigkeit(Beispiel: Stichprobe von 1000 Arbeitnehmer ,,gezogen aus derGrundgesamtheit aller Arbeitnehmer”)
o Reihenfolge der Daten nicht bedeutendo Symbol: xi, i = 1, . . . , n, d.h. es gibt n Querschnittseinheiten
5
Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten
Datenarten: Querschnitts- und Zeitreihendaten
• Zeitreihendaten
o Daten fur eine oder mehrere Variablen uber die Zeit(Beispiele: Inflationsrate vom 1. Quartal 1990 bis 4. Quartal 1999,Dax-Index vom 03.01.2006-30.06.2006)
o Haufig: hohe Abhangigkeit (Korrelation) uber die Zeit (Beispiel: BIP)o Reihenfolge der Daten ist bedeutsamo Symbol: xt, t = 1, . . . , T , d.h. es gibt T Beobachtungspunkteo Datenfrequenz: taglich, wochentlich, monatlich, vierteljahrlich, jahrlicho Saisonale Effekte
6
Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten
Datenarten: Gepoolte Querschnitts- und Paneldaten
• Gepoolte Querschnittsdaten
o Daten von verschiedenen Querschnittseinheiten fur mehrereZeitpunkte(Beispiel: Haushaltsstichproben in den Jahren 1996 und 1998)
o Gemeinsame Analyse mehrerer Zufallsstichproben:Hohere Anzahl von BeobachtungenAnalyse von Veranderungen uber die Zeit(Beispiel: Analyse der Effekte der Gesundheitsreform von 1997mit Hilfe von Daten aus 1996 und 1998)
7
Empirischen Volkswirtschaftslehre 1.2 Statistische Grundbegriffe und Datenarten
Datenarten: Gepoolte Querschnitts- und Paneldaten
• Paneldaten
o Daten von gleichen Querschnittseinheiten fur mehrere Zeitpunkte(Beispiel: Sozio-okonomische Panel (SOEP) des DIW)
o Paneldaten erlaubenKontrolle von so genannten ,,unbeobachteten Individualeffekten”Analyse von zeitverzogerten Effekten(Beispiel: Investition in Abhangigkeit von Firmencharakteristikaaus Vorperioden)
8
Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen
Datenquellen
• Amtliche Statistik
o Statistisches Bundesamt, Eurostat, EZB, Bundesbank, Bundesagenturfur Arbeit
• Nichtamtliche Statistik
o Sachverstandigenrat zur Begutachtung der gesamtwirtschaftlichenEntwicklung, VGR des DIW, OECD, UNO, IWF, Weltbank
• Haushalts- und Unternehmensbefragungen
o SOEP, Konjunkturindikatoren (z.B. Geschaftsklimaindex des ifoInstituts), Befragung von Finanzmarktexperten durch das ZEW
• Spieltheoretische und andere Experimente
9
Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen
Datenerhebung
• Befragungen
o Beispiele: Haushalts- und Unternehmenspanel, Umfragen
• Meldepflichten von Unternehmen und Institutionen
o Beispiele: Amtliche Statistiken, EZB/Bundesbank, Finanzbehorden
• Automatische (computergestutzte) Erfassung
o Beispiele: Finanzmarktdaten (Borsenkurse, Optionspreise etc.)
• Sonstige Erhebungen
o Beispiele: Firmeninterne Erfassung von Daten, Einzelhandelspreise alsBasis fur Preisindexberechnung
• Wichtige theoretische Basis: Stichprobentheorie
10
Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen
Auswahl geeigneter Daten: Probleme
• Messen die Daten die okonomisch relevante Große?
o Beispiel: Wirtschaftsaktivitat vs. BIP
• Datenqualitat: Sind Messfehler wahrscheinlich?
o Beispiele: Falsche Angabe von Einkommen bei Haushaltsbefragungen,Tipp- und Schreibfehler
• Durfen wir Variablen im okonometrischen Modell aufgrund mangelnderDatenverfugbarkeit auslassen?
o Beispiele: Fahigkeit/Intelligenz in Lohnmodellen, Tag der Prufung imRahmen von Leistungsstudien (z.B. PISA)
11
Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen
Auswahl geeigneter Daten: Probleme
• Enstprechen die okonometrischen Modellannahmen denDateneigenschaften?
o Beispiel: Unabhangigkeit der Stichprobe
• Konsequenzen fur empirische/okonometrische Analyse?
o Bestimmung der Effekte von z.B. Messfehlerno Entwicklung und Anwendung von adaquaten okonometrischen
Methoden
12
Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen
Elementare Datentransformationen
• Querschnittsdaten: Quotenbildung
o Beispiel: Bruttowertschopfung in Sektor k, xk, k = 1, . . . , K
Anteil von Sektor k: qk =xk∑Kj=1 xj
, k = 1, . . . , K
• Zeitreihendaten: Bildung von Indexreihe
o Beispiel: Bruttowertschopfung in Sektor k, xkt, fur die Jahre1991-2005, t = 1, . . . , 10Indexreihe fur xkt fur Basisjahr 1991, d.h. Index=100 in 1991ikt = (xkt/xk1)× 100, t = 1, . . . , 10, ⇒ ik1 = 100,
13
Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen
Elementare Datentransformationen
• Zeitreihendaten: Wachstumsraten
o Beispiel: vierteljahrliches BIP-Wachstum zwischen 1991:1-1999:4BIP-Zeitreihe: xt, t = 1, . . . , 40
Zeitreihe der BIP-Wachstumsraten: rt =xt − xt−1
xt−1, t = 2, . . . , 40
Bestimmung der Wachstumsraten erst ab der zweiten Beobachtungmoglich!Wachstumsrate uber mehrere Perioden entspricht nicht der Summeder einperiodigen Wachstumsraten: wegen Zinseszinseffekt
14
Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen
Elementare Datentransformationen
• Log-Transformation
o Basisvariable x, log-Transformation: ln(x)
o Regressionsmodelle: Interpretation der Koeffizienten als Semielastizitatbzw. Elastizitat bei Verwendung von logarithmierten Variablen
o Varianzglattung, falls Varianz mit Niveau der Variable ansteigt
o Bildung von (Log-)Wachstumsraten als Differenz von Logarithmen:Zeitreihe der BIP-(Log-)Wachstumsraten: rlt = ln(xt)− ln(xt−1)
Beachte: rlt = ln(xt)− ln(xt−1) ≈ rt, falls rt klein istLog-Wachstumsrate uber mehrere Perioden ergibt sich als Summe dereinperiodigen Log-Wachstumsraten
15
Empirischen Volkswirtschaftslehre 1.3 Datenquellen, -erhebung, und -transformationen
Reale vs. nominale Variablen
• Nominale Variable y und Preisindex p ⇒ Reale Variable x = (y/p)× 100
• Typische Anwendung fur Zeitreihenvariablen: Nominales und reales BIP
o Nominale BIP-Zeitreihe: yt, t = 1, . . . , T
o Preisindexzeitreihe: pt, t = 1, . . . , T , mit p1 = 100o Reale BIP-Zeitreihe: xt = (yt/pt)× 100, t = 1, . . . , T
16
Empirischen Volkswirtschaftslehre 1.4 Computergestutze Datenanalyse
Datenzugang
• Die meisten Daten sind in elektronischer Form verfugbar
o Makro- und Finanzmarktdaten via CD oder Internetdatenbanken:Eurostat, Statistisches Bundesamt, EZB, International StatisticalYearbook (IMF), Main Economic Indicators (OECD), ThomsonDatastream, EcoWin, Yahoo-Finanzen etc..
o Mikrodatensatze mit Haushalts- oder UnternehmensdatenDatenschutz: eingeschrankter Zugang
• Beispiele fur nichtelektronischen Datenzugang
o Viele der o.g. Institutionen veroffentlichen Daten auch in gedruckterForm
o ,,Historische” Statistiken wie z.B. Handelstatistik des DeutschenReiches
17
Empirischen Volkswirtschaftslehre 1.4 Computergestutze Datenanalyse
Software
• Tabellenkalkulationsprogramme: Deskriptive Analyse
• Statistik- und Okonometrieprogramme: STATA, EViews, R, GAUSS
o Dateneinleseno Umfangreiche Datenanalyse: Regressionsanalyse u.a. komplexe
statistische und okonometrische Methodeno Programmierung von nicht implementierten Methodeno Simulationen zur Evaluation von statistischen Verfahren, z.B. Tests
18
Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik
Zufallsvariablen
• Annahme: Betrachtete Variablen sind zufallig, d.h. stochstisch
• Beispiel Lohngleichung fur Arbeitnehmer
• Motivation I
o Stichprobe von 1000 Arbeitnehmer aus Grundgesamtheit allerArbeitnehmer
o Stichprobe bezuglich Lohn: {W1, . . . , W1000}o Zufallige Auswahl ⇒ Lohn von Arbeitnehmer i, Wi, ist eine
Zufallsvariable
19
Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik
Zufallsvariablen: Motivation II
• Okonomisches LohnmodellW = f (Ausbildung, Berufserfahrung, Umfang von Qualifizierung,Fahigkeit)
• Okonometrisches LohnmodellW = β0 + β1ausb + β2befahr + β3quali + U
• Grunde fur Berucksichtigung von Fehlerterm U
o Intrinsische Zufalligkeit: okonomisches Modell gilt nicht exakto Messfehler, schlechte Proxyvariablen (z.B. Ausbildungszeit)o ausgelassene Variablen (z.B. Fahigkeit)o falsche funktionale Form (z.B. lineare Form)
20
Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik
Zufallsvariablen: Motivation II
• Sinnvolle/Notwendige Annahme:Effekte des Fehlerterms sind nicht systematisch, sondern zufalligU ist eine Zufallsvariable, z.B. mit U ∼ (0, σ2)
• Wenn U eine Zufallsvariable ist, dann ist auch W eine Zufallsvariable,wegen W = β0 + β1ausb + β2befahr + β3quali + U
• Unterschiedliche Annahmen bzgl. erklarender Variablenausb, befahr, quali
o Realistisch: auch Zufallsvariableno Haufig: deterministisch Variablen, um Eigenschaften von
okonometrischen Methoden (Schatzer, Tests) einfacher herleiten zukonnen
21
Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik
Stochastischer Modellrahmen
• Welche Konsequenz hat der stochastische Modellrahmen?
• Wie konnen wir den stochastische Modellrahmen nutzen, um etwas uberdie Grundgesamtheit zu lernen?
22
Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik
Stochastischer Modellrahmen: Konsequenz
• Unterscheide Zufallsvariablen und Daten
• Beispiel: Zufallsexperiment zu Durchschnittsalter der EVWL-Studenten
o Grundgesamtheit: Alle EVWL-Studenteno Zufallige Auswahl von 10 Studenten
Jeder Student hat gleiche Chance, einzelne Auswahlentscheidungensind unabhangig =⇒ ,,Ziehen mit Zurucklegen”
o Zufallsstichprobe: {Y1, . . . , Y10}mit Yi = Alter von Student i, Yi ist eine Zufallsvariable
o Nach Auswahl: Daten bzw. Realisationen (y1, . . . , y10) liegen vor;Sie sind nicht zufallig!
o Daten variieren je nach Stichprobe
23
Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik
Stochastischer Modellrahmen: Inferenz
• Wir verwenden Daten um auf Eigenschaften der Grundgesamtheit(hier: Durchschnittsalter µ) zu schließen: Inferenz
• Schatzer/Schatzregel: Arithmetisches Mittel der Stichprobenvariablen
o Y =110
∑10i=1 Yi
o Y ist eine Zufallsvariable, da es eine Funktion von Zufallsvariablen ist
• Schatzwert/Schatzung: Arithmetisches Mittel der Daten
o y =110
∑10i=1 yi
o y ist keine Zufallsvariable, sondern ein Zahlenwert
24
Empirischen Volkswirtschaftslehre 1.4 Rolle der Stochastik
Stochastischer Modellrahmen: Inferenz
• Stochastischer Modellrahmen erlaubt Evaluation okonometrischerVerfahren, z.B. von Schatzern (aber auch Entwicklung von Verfahren)
• Relevante Frage: Ist unser(e) Schatzer/Schatzregel gut?
o Idee: Konnen unendlich viele Stichproben ziehen⇒ unendlich viele Schatzwerte
o Machen wir im Mittel einen Fehler, d.h. gilt E[Y ] = µ oder nicht?o Abstrakte Eigenschaft: oft nur eine Stichprobe verfugbaro Ableitung der Eigenschaften von Schatzern ist eine der Hauptaufgaben
der Okonometrie: verlangt Kenntnisse uber Wahrscheinlichkeitstheorieund induktiver Statistik
• Konkreter Schatzwert ist richtig oder falsch! Wir wissen es aber nie!
o Es gilt immer: E[y] = y, da y nicht zufallig
25