Achtung Terminänderung !!! Klausur am 6. August 2008 nicht am 8.8.2008 9:00 – 13:00 Uhr Hörsaal...

Preview:

Citation preview

Achtung Terminänderung !!!

Klausur am 6. August 2008Klausur am 6. August 2008

nicht am 8.8.2008

9:00 – 13:00 UhrHörsaal LöfflerstraßeHörsaal Makarenkostraße

Statistische Methoden II SS 2008

Vorlesung: Prof. Dr. Michael SchürmannZeit: Freitag 10.00 - 12.30 (Pause: 11.30 - 11.45)Ort: Hörsaal Makarenkostraße (Kiste)

ÜbungenGruppe 2: Hermann Haase Di 8.00 - 10.00 SR

222Gruppe 1: Hermann Haase Di 10.00 - 12.00 SR

222Gruppe 5: Svenja Schützhold Di 12.00 - 14.00 SR

222Gruppe 7: Sebastian Grapenthin Di 14:00 - 16:00 HS

11Gruppe 8: Svenja Schützhold Di 16:00 -18:00 SR 5Gruppe 4: Sabine Storandt Mi 8.00 - 10.00 SR

222Gruppe 3: - fällt weg - Mi 10.00 - 12.00 SR

222Gruppe 6: Sebastian Grapenthin Mi 12.00 - 14.00 SR 3

SR 222 : Fleischmannstraße 6SR 3 + 5 : Loefflerstraße 70HS 11 : Domstraße 9a (Hist. Institut)

Statistische Methoden I WS 2007/2008

Einleitung: Wie schätzt man die Zahl der Fische in einem See?Zur Geschichte der Statistik

I. Beschreibende Statistik

1. Grundlegende Begriffe

2. Eindimensionales Datenmaterial2.1. Der Häufigkeitsbegriff2.2. Lage- und Streuungsparameter2.3. Konzentrationsmaße (Lorenz-Kurve)

3. Mehrdimensionales Datenmaterial3.1. Korrelations- und Regressionsrechnung3.2. Indexzahlen3.3. Saisonbereinigung

II. Wahrscheinlichkeitstheorie1. Laplacesche Wahrscheinlicheitsräume

1.1. Kombinatorische Formeln1.2. Berechnung von Laplace-Wahrschein-

lichkeiten2. Allgemeine Wahrscheinlichkeitsräume

2.1. Der diskrete Fall2.2. Der stetige Fall2.3. Unabhängigkeit und bedingte

Wahrscheinlichkeit3. Zufallsvariablen

3.1. Grundbegriffe3.2. Erwartungswert und Varianz

3.3. Binomial- und Poisson-Verteilung 3.4. Die Normalverteilung und der Zentrale Grenzwertsatz

4. Markov-Ketten 4.1. Übergangsmatrizen 4.2. Grenzverhalten irreduzibler Markov-Ketten 4.3. Gewinnwahrscheinlichkeiten 4.4. Beispiel „Ruin der Spieler“ 4.5. Anwendungen

III. Induktive Statistik

1. Schätztheorie 1.1. Grundbegriffe, Stichproben 1.2. Maximum-Likelihood-Schätzer 1.3. Erwartungstreue Schätzer 1.4. Konfidenzintervalle 1.5. Spezialfall Binomial-Verteilung

2. Spezialfall Normalverteilung 2.1. Student- und Chi-Quadrat-Verteilung 2.2. Konfidenzintervalle

3. Tests 3.1. Grundbegriffe 3.2. Tests einfacher Hypothesen (Neyman-Pearson-Test) 3.3. Tests zusammengesetzter Hypothesen 3.4. Vergleich zweier unabhängiger Stichproben 3.5. Chi-Quadrat-Tests 3.6. Kolmogorov-Smirnov-Test 3.7. Einfache Varianzanalyse

Statistische Methoden IWS 2007/2008

Literatur

1) G. Bamberg, F. Baur: Statistik. Oldenbourg 2) G. Bamberg, F. Baur: Statistik-Arbeitsbuch. Oldenbourg 3) L. Fahrmeir, R. Künstler, I. Pigeot, G. Tutz: Statistik. Springer 4) J. Schira: Statistische Methoden der VWL und BWL. Pearson Education 5) H. Haase: Stochastik für Betriebswirte. Shaker 6) J. Hartung: Statistik. Oldenbourg 7) R. Schlittgen: Einführung in die Statistik. Oldenbourg 8) A. Quatember: Statistik ohne Angst vor Formeln. Pearson Studium 9) H.-D. Radke: Statistik mit Excel. Markt + Technik

Die wichtigsten Tabellen

Übersicht IKonfidenzintervalle

für den Erwartungswert

Übersicht IIKonfidenzintervalle

für die Varianz

Test für den ErwartungswertVarianz bekannt

Fall Normalverteilung

Test für den ErwartungswertVarianz unbekannt

Fall Normalverteilung

Chi-Quadrat-Tests

Übersicht

Faustregeln Chi-Quadrat-TestsChi-Quadrat-Tests

Test auf Anpassung

Test auf Unabhängigkeit

Test auf Homogenität

Weitere nützliche Übersichtenin den Powerpoint-Präsentationen

der Vorlesung!

http://www.math-inf.uni-greifswald.de/algebra/

Beschreibende Statistik

Darstellung von Daten (Stem-Leaf-Diagramm, Box-Plot) Absolute und relative Häufigkeiten Empirische Verteilungsfunktion Lageparameter (arithmetisches Mittel, Median, Quantile, Quartile) Streuungsparameter (Varianz, emp. Varianz, Streuung) Lorenz-Kurve, Gini-Koeffizient Kovarianz

Korrelationskoeffizient nach Bravais-Pearson Regressionsrechnung (lineare Regression, Regressionsgerade, Bestimmtheitsmaß)

Peisindex nach Laspeyres und nach Paasche

Zentrale Themen(praktischer Teil)

Beschreibende Statistik(= Deskriptive Statistik)Beschreibung von Datenmaterial

Schließenden Statistik(= Induktive Statistik)Analyse von Datenmaterial,Hypothesen, Prognosen

1. Semester

2.Semester

Wahrscheinlich-keitstheorie

1. Semester

HäufigkeitenGegeben ist eine Datenliste (Urliste)

(hier z. B. die Klausur-Noten von 50 Studenten) 3 3 4 5 2 1 3 3 4 3

2 3 4 4 4 5 2 1 3 33 3 4 4 4 5 4 3 4 32 3 3 2 4 3 2 1 5 44 4 5 4 5 1 1 3 3 3

Hier die geordneten Daten

1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 45 5 5 5 5 5

Absolute Häufigkeiten

H(1) = 5H(2) = 6H(3) = 18H(4) = 15H(5) = 6

h(1) = 0.1 h(2) = 0.12h(3) = 0.36h(4) = 0.3h(5) = 0.12

Relative Häufigkeiten

Kumulierte relative Häufigkeiten

F(1) = 0.1F(2) = 0.22F(3) = 0.58F(4) = 0.88F(5) = 1

Fakultäten EMAUBerechnung der Winkel für ein Kreisdiagramm

T: TheologischeRSW: Rechts- und Staatswiss.Med: MedizinischePhil: PhilosophischeMathNat: Mathematisch-Naturwiss.K: Studienkolleg, ...

h(T) = 0.011 h(RSW) = 0.22h(Med) = 0.164h(Phil) = 0.309h(MathNat) = 0.273h(K) = 0.022

3.96 Grad 79.2 Grad 59.04 Grad111.24 Grad 98.28 Grad 7.92 Grad

Kreisdiagramm Fakultäten EMAU

Stabdiagramm „Zähne“

Histogram „Zähne“

Empirische Verteilungsfunktion„Zähne“

Stem-Leaf-Diagramm

Bei diesem Diagramm werden meist (siehe aber Aufgabe 3)nur die beiden führenden Ziffern berücksichtigt. Die erste Ziffer wird links von einer senkrecht gezogenen Linieeingetragen. Damit hat man den Stamm.

Die zweiten Ziffern - die Blätter - werden rechts davonnotiert, und zwar zeilenweise aufsteigend geordnet. Dabei muss jeder Wert des Datensatzes durch einezweite Ziffer (ggf. Null!) repräsentiert werden.

Kaltmieten

Charakterisierung von Merkmalen

Merkmalen

quantitative: Merkmale unterscheiden sich nach der Größequalitative: Merkmale unterscheiden sich nach der Art

Unterscheidung nach der zugrundeliegenden Werteskala

Nominal-Ordinal-metrische

Skala

Unterscheidung zwischen

qualitativenquantitativen

Nominal: keine RangordnungOrdinal: Rangordnung, aber Zwischenwerte nicht interpretierbarmetrisch: Rangordnung, Werte zwischen 2 Werten erlauben eine Interpretation

Unterscheidung nach

diskretenstetigen Merkmalen

diskret: Menge der Werte abzählbar (evtl. abzählbar unendlich)stetig: Menge der Werte kontinuierlich, (z.B. reelle Zahlen oder ein Intervall reeller Zahlen)

Ordinal, diskret

metrisch, diskret

metrisch, stetig

Ordinal, diskret

Arithmetisches Mittel

Merkmal

Datensatz

Median

Merkmal

Geordneter Datensatz

n ungerade: Wert, der in der Mitte steht

n gerade: arithmetisches Mittel der beiden Werte, die in der Mitte stehen

Aufgabe 1

Aufgabe 2

Quantile

Boxplot

Ober-, Untergrenze der „Box“: oberes, unteres Quartil„dicker Strich“ in der Box: Median

Ausreißer nach oben:Werte > oberes Quartil + 1.5 Quartilsabstand

Ausreißer nach unten:Werte < unteres Quartil - 1.5 Quartilsabstand

Jeder Ausreißer wird mit einem Symbol gesondert einge-tragen. Antennen: größter und kleinster Wert in der Datenliste, der kein Ausreißer ist

Aufgabe 3

Aufgabe 4

Mittelwert oder Median

Grobe Faustregeln

Metrische Skalierung

Ordinale Skalierung

Ausreißer wahrscheinlich

Wenn sich die Werte „irdendwie“gegeneinander ausgleichen

Mittelwert

Median

Median

Mittelwert

Streuungsparameter

Median

Mittlere Abweichung vom Median

Die Ungleichung gilt für jede Konstante c.

StreuungsparameterMittelwert

Varianz

Die Ungleichung gilt für jede Konstante c.

Rechenregeln für Mittelwert, Varianz und Streuung

Rechenregeln für Mittelwert, Varianz und Streuung

Rechenregeln für Mittelwert, Varianz und Streuung

Berechnung von Streuungsparametern an einem einfachen Beispiel

Recommended