25
Betrachtung der Realität aus Betrachtung der Realität aus der Sicht der Statistik der Sicht der Statistik VARIABILITÄT VARIABILITÄT Scuola Secondaria 1°grado; Argomento: Leggiamo - Variabilità; (30.09.13); Pacchetto: S1.A.4 Übersetzung: / Tradotto da:

Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT

  • Upload
    trish

  • View
    42

  • Download
    6

Embed Size (px)

DESCRIPTION

Betrachtung der Realität aus der Sicht der Statistik VARIABILITÄT. Übersetzung: / Tradotto da:. Scuola Secondaria 1°grado; Argomento: Leggiamo - Variabilità; (30.09.13); Pacchetto: S1.A.4. VARIABILITÄT. Was ist die VARIABILITÄT? Wie misst man die Variabilität? - PowerPoint PPT Presentation

Citation preview

Page 1: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

Betrachtung der Realität aus Betrachtung der Realität aus der Sicht der Statistik der Sicht der Statistik

VARIABILITÄTVARIABILITÄT

Scuola Secondaria 1°grado; Argomento: Leggiamo - Variabilità; (30.09.13); Pacchetto: S1.A.4

Übersetzung: / Tradotto da:

Page 2: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

VARIABILITÄT

1) Was ist die VARIABILITÄT?2) Wie misst man die Variabilität?3) Die Variabilität als Distanzmaß4) Die Variabilität als Distanzmaß von

einem Zentrum5) Varianz6) Standardabweichung7) Relative Streuungsmaße

Page 3: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

3

Darunter versteht man, dass ein Phänomen bei den einzelnen Erhebungseinheiten der Grundgesamtheit verschiedene Ausprägungen annehmen kann.

Die Variabilität ist umso größer, je größer die Unterschiede zwischen den einzelnen Fällen sind.

Die Lagemaße wie Mittelwert, Median oder Modus geben keine Auskunft darüber, wie die Einheiten dazu tendieren, unterschiedliche Werte anzunehmen.

Was ist die VARIABILITÄT?

Page 4: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

4

Reicht der Mittelwert, um die Daten darzustellen?

Semesterende – um die schulischen Leistungen einzuschätzen, berechnen wir den Mittelwert der Noten in Mathematik. Das sind die Noten, die drei Schüler bekommen haben:

MARCO 6 5 6 7 MITTELWERT=6LUCA 6 6 6 6 MITTELWERT=6LUIGI 4 4 8 8 MITTELWERT=6

Die Schüler haben den gleichen Durchschnitt, aber die Noten sind sehr… UNTERSCHIEDLICH

Page 5: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

5

Wie misst man die Variabilität?

Der Mittelwert sagt nichts über die Variabilität der Daten aus. Dazu müssen wir ein STREUUNGSMASS verwenden.

Nehmen wir an, dass jede Kugel eine Erhebungseinheit ist…

Page 6: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

6

Die Variabilität als Distanzmaß

Die Variabilität nimmt zu, wenn die Distanz zwischen den Beobachtungen zunimmt.

Das ist das einfachste Maß, da es nur die Positionen von zwei Erhebungseinheiten berücksichtigt. Sie ist die Differenz zwischen dem beobachteten Maximum und Minimum.

SPANNWEITE=MAX-min

Page 7: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

7

Welcher unserer Schüler hat die größte Variabilität?

Wir berechnen die SPANNWEITE, indem wir das Maximum heranziehen und das Minimum davon abziehen.

MARCO 6 5 6 7 SPANNWEITE=7-5=2LUCA 6 6 6 6 SPANNWEITE=6-6=0LUIGI 4 4 8 8 SPANNWEITE=8-4=4

Luigi hat die unterschiedlichsten Noten, während Lucas Noten überhaupt nicht variieren.

Page 8: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

8

Die SPANNWEITE ist ein unmittelbares Maß, aber…

…es ist sensibel: es berücksichtigt nur die Extremwerte, die durch außergewöhnliche und unnormale Werte beeinflusst sein können, während alle anderen beobachteten Werte außer Acht gelassen werden.

Ein besser geeignetes Maß muss ALLE ERHEBUNGSEINHEITEN BERÜCKSICHTIGEN!

Aber alle möglichen Unterschiede zwischen allen Erhebungseinheiten zu berücksichtigen ist zu aufwändig! Eine Lösung ist…

Page 9: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

9

Die Variabilität als Distanzmaß von einem Zentrum

Ein besser geeignetes Streuungsmaß muss also als Distanzmaß jeder Beobachtung vom Mittelwert der Daten funktionieren.

Die Variabilität nimmt zu, wenn die Distanz zwischen den Beobachtungen und dem Zentrum der Beobachtungen steigt.

Page 10: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

10

Lasst uns versuchen, ein Streuungsmaß zu erstellen!

Um die Distanz jeder Beobachtung vom Mittelwert zu messen, können wir die Operation Differenz verwenden!

Wir definieren unsere DatenX ist das beobachtete Phänomen (statistische Variable)x1,x2,x3,…,xi,…,xn sind die beobachteten Werte der n Erhebungseinheiten

x1 x2

x3

x4x6

x5x7

x8

x8M

ist der arithmetische Mittelwert von n beobachteten Werten

Page 11: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

Abweichungen oder Differenzen vom Mittelwert

Mit welcher mathematischen Formel kann ich die Distanz zwischen zwei beobachteten Werten messen? Mit der Differenz!

Wenn wir alle Differenzen (auch ABWEICHUNGEN genannt) nehmen und die Summe bilden erhalten wir jedoch…

0)(...)( 21 MxMxMx n

Der arithmetische Mittelwert ist der Punkt, an dem die Daten im Gleichgewicht sind. Der Mittelwert gleicht die niedrigsten und die höchsten Werte aus und genau deshalb ist die Summe der Abweichungen vom Mittelwert gleich NULL.

Page 12: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

Die kleinsten Quadrate!!!

Von den verschiedenen Eigenschaften des arithmetischen Mittelwerts könnten wir jene der kleinsten Quadrate nutzen. Diese besagt, dass

die Summe der Quadrate der Abweichungen vom arithmetischen Mittelwertdas Minimum der Summe der Abweichungen von jedem anderen Wert ist.

min)(...)( 222

21 MxMxMx n

Page 13: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

Die Summe der Quadrate der Abweichungen…

ist immer größer als null

ist nur dann gleich null, wenn die Variable nicht variiert

steigt mit der Zunahme der Dispersion der Beobachtungen

vom Mittelwert

steigt auch mit der Zunahme der Anzahl der Beobachtungen

(n)

wird als Quadrat der Maßeinheit der Variablen ausgedrückt

222

21 )(...)( MxMxMx n

Page 14: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

14

Varianz

Teilt man die Summe der Abweichungen zum Quadrat durch n, um die Auswirkung aufgrund der Anzahl der Beobachtungen auszuschalten,

erhält man die VARIANZ. Sie wird allgemein mit („Sigma hoch 2“) angegeben.

Um ein Streuungsmaß in derselben Maßeinheit der beobachteten Daten zu erhalten, müssen wir die Quadratwurzel der Varianz ziehen!

222

22

1 )(...)(

n

MxMxMx n

Page 15: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

Die Varianz wird als Quadrat der Maßeinheit der beobachteten Variablen ausgedrückt. Ihr Wert ist also nicht unmittelbar verständlich.Häufiger wird die Standardabweichung verwendet.Eigenschaften:

Gleiche Maßeinheit wie beim Merkmal Definiert die durchschnittliche Distanz der Beobachtungen vom arithmetischen Mittelwert

Bei n Beobachtungen x1,x2,…,xn lautet die Formel

Standardabweichung

n

MxMxMx n22

22

1 )(...)(

Page 16: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

Wir rechnen mit Marcos Noten

Noten von MARCO

Abweichun-gen vom

Mittelwert

Quadrate der Abweichun-

gen

6 (6-6)=0 05 (5-6)=-1 16 (6-6)=0 07 (7-6)=1 1

Insgesamt 24 0 2Varianz 0,5Standard-abweichung 0,71

Im Falle von Daten in einer REIHE

Page 17: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

Und jetzt auch für Luca und Luigi!

Noten von LUCA

Abwei-chungen

vom Mittelwert

Quadrate der

Abwei-chungen

Noten von LUIGI

Abwei-chungen

vom Mittelwert

Quadrate der

Abwei-chungen

6 0 0 4 (4-6)=-2 46 0 0 4 (4-6)=-2 46 0 0 8 (8-6)=2 46 0 0 8 (8-6)=2 4

24 0 0 24 0 16Varianz 0 Varianz 4Standard-abweichung 0

Standard-abweichung 2

Luigis Noten sind am unterschiedlichsten – wir bestätigen das, was wir bereits mit der SPANNWEITE erkannt haben!

Page 18: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

Wenn die Daten in einer Häufigkeitstabelle zusammengefasst sind, wird jede Abweichung mit der entsprechenden absoluten Häufigkeit gewichtet.

Standardabweichung

n

nMxnMxnMx kk

22

221

21 )(...)(

Wir erstellen eine Häufigkeitstabelle mit den Daten der drei Schüler und berechnen den Mittelwert und die Standardabweichung. Insgesamt haben wir n=12 Beobachtungen.

Page 19: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

19

Üben wir mit Daten in der Tabelle!

22,1

12

18)(...)( 22

221

21

n

nMxnMxnMx kk

Page 20: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

Sie messen die Variabilität eines Phänomens, einer Variablen, einer Verteilung.

Man unterscheidet zwischen:

absoluten Maßen, die in derselben Maßeinheit ausgedrückt werden wie das untersuchte Phänomen:

Spannweite Standardabweichung …

• relativen Maßen, die unabhängig von der Maßeinheit sind und sich deshalb dazu eignen, unterschiedliche Phänomene zu vergleichen. Man erhält sie, indem man ein absolutes Maß mit einem Mittelwert oder mit dem Maximum in Beziehung setzt.

Streuungsmaße

Page 21: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

Relative Streuungsmaße

Sie erlauben Vergleiche der Variabilität von Verteilungen, die mit unterschiedlichen Maßeinheiten dargestellt werden (z.B. Gewicht und Größe)

von Verteilungen, die mit derselben Maßeinheit dargestellt werden, aber von der unterschiedlichen Intensität desselben Phänomens beeinflusst werden (z.B. Gewicht der Neugeborenen und Gewicht der Mütter).

Das bekannteste Streuungsmaß ist der Variationskoeffizient.

100M

Page 22: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

22

Sein Bruder besucht die Universität und hat im letzten Semester die folgenden Noten (in Dreißigsteln) bekommen.

Marco vergleicht sich mit seinem Bruder!

Noten von Marcos Bruder

Abweichungen vom

Mittelwert

Quadrate der Abweichungen

25 (25-22)=3 9

20 (20-22)=-2 4

22 (22-22)=0 0

21 (21-22)=-1 1

88 0 14

Page 23: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

23

Wer weist die größere Variabilität auf?

Fassen wir alles in einer Tabelle zusammen!

Die größere Variabilität hat derjenige, der den höheren Variationskoeffizienten hat: Marco!

Page 24: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

Versuchen wir es nun mit realen Daten!

Quelle: Ministero di agricoltura, industria e commercio (fino al 1923); Istituto di economia e statistica agraria (anni 1924-1926); Istat, Stima delle superfici e produzioni delle coltivazioni agrarie, floricole e delle piante intere da vaso (dal 1927)

Produktion einiger Getreidearten - Jahre 1921-2011 (Zentner je Hektar)

Welche der drei Getreideproduktionen (Weizen, Reis oder Mais) ist am variabelsten?

Die Produktion von Mais hat die größte Spannweite. Die Produktion von Weizen hingegen schwankt am wenigsten!

Page 25: Betrachtung der Realität aus der Sicht der Statistik  VARIABILITÄT

……und jetzt…und jetzt…Gute Arbeit!Gute Arbeit!

Rete per la promozione della cultura statistica

Übersetzung: / Tradotto da: