6
1 Olika typer av variabler och skalor Kvalitativ variabel -variabeln antar inte numeriska värden utan bara olika kategorier. Exempelvis olika bilmärken, eller man, kvinna. Kvantitativ variabel Antar numeriska värden som är resultat av beräkning eller mätning. Kontinuerlig variabel Kan anta alla värden. Ex, kroppslängd Diskret variabel Kan enbart anta vissa värden, (oftast heltal). Ex, antal barn. En variabel kan mätas på 4 olika typer av skalor: 1. Nominalskala 2. Ordinalskala 3. Intervallskala 4. Kvotskala Varför behöver vi veta vilken skala en variabel är mätt på? Skaltypen avgör vilka beräkningar, diagram och statistiska test som vi kan använda. Nominalskala En kvalitativ variabel där de olika utfallen inte har en specifik ordningsföljd mäts på nominalskala. Exemel: Bilmärke: Volvo, BMW, VW, Peugot Kön: man, kvinna Ordinalskala Vi kan rangordna olika observationer men inte avgöra avståndet mellan dem. Exempel: I en kursutvärdering frågas studenterna vad de anser om litteraturen och har följande alternativ att välja på. Mycket bra, bra, medel, dålig Intervallskala Vi kan mäta avståndet mellan två variabelvärden men kvoter har ingen meningsfull tolkning och nollan kan ej tolkas som avsaknad av egenskapen. Temperatur mätt i grader Celsius är ett exempel. På söndag är det 0 grader. På måndag är det 1 grad varmt. På tisdag är det 2 grader varmt. På onsdag är det 21 grader varmt. På torsdag är det 22 grader varmt. På söndag är det 273 K. På måndag är det 274 K. På tisdag är det 275 K. På onsdag är det 294 K. På torsdag är det 295 K. Kvotskala Det är meningsfullt att beräkna kvoter och noll betyder att egenskapen saknas. Exempel kroppslängd. Om Lisa är 80 cm lång och hennes mamma 160 så är mamma dubbelt så lång. Det är meningsfullt att dividera mammas längd med Lisas och beräkna en kvot. Om Kalle är 0 cm lång så finns han inte. Nollan betyder avsaknad av egenskapen. Årtal Årtal såsom 2010 och 2017 vilken skala mäts de på? Om vi är intresserade av hur länge sedan det var som Jesus föddes så har vi en kvotskala, för då får noll betydelsen att det är just nu han föds. Men oftast använder vi dem bara för att sortera in händelser i tiden och mäta hur lång tid det är mellan dem. I så fall blir det en intervallskala.

deskriptiv statistik 1 - natskolan.senatskolan.se/course/STA101/lecture/deskriptiv 1.pdfï 3n ylonhq vndod vnxooh yl plwd yduldehoq ´8wrpkxvwhpshudwxu l judghu &hovlxv´ " 1rplqdovndod

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: deskriptiv statistik 1 - natskolan.senatskolan.se/course/STA101/lecture/deskriptiv 1.pdfï 3n ylonhq vndod vnxooh yl plwd yduldehoq ´8wrpkxvwhpshudwxu l judghu &hovlxv´ " 1rplqdovndod

1

Olika typer av variabler och skalor

Kvalitativ variabel

-variabeln antar inte numeriska värden utan bara olika kategorier. Exempelvis olika bilmärken, eller man, kvinna.

Kvantitativ variabel

Antar numeriska värden som är resultat av beräkning eller mätning.

Kontinuerlig variabel

Kan anta alla värden.

Ex, kroppslängd

Diskret variabel

Kan enbart anta vissa värden, (oftast heltal).

Ex, antal barn.

En variabel kan mätas på 4 olika typer av skalor:

1. Nominalskala2. Ordinalskala3. Intervallskala4. Kvotskala

Varför behöver vi veta vilken skala en variabel är mätt på?

Skaltypen avgör vilka beräkningar, diagram och statistiska test som vi kan använda.

Nominalskala

En kvalitativ variabel där de olika utfallen inte har en specifik ordningsföljd mäts på nominalskala.

Exemel:

Bilmärke: Volvo, BMW, VW, Peugot

Kön: man, kvinna

Ordinalskala

Vi kan rangordna olika observationer men inte avgöra avståndet mellan dem.

Exempel: I en kursutvärdering frågas studenterna vad de anser om litteraturen och har följande alternativ att välja på.

Mycket bra, bra, medel, dålig

Intervallskala

Vi kan mäta avståndet mellan två variabelvärden men kvoter har ingen meningsfull tolkning och nollan kan ej tolkas som avsaknad av egenskapen.

Temperatur mätt i grader Celsius är ett exempel.

På söndag är det 0 grader.

På måndag är det 1 grad varmt.

På tisdag är det 2 grader varmt.

På onsdag är det 21 grader varmt.

På torsdag är det 22 grader varmt.

På söndag är det 273 K.

På måndag är det 274 K.

På tisdag är det 275 K.

På onsdag är det 294 K.

På torsdag är det 295 K.

Kvotskala

Det är meningsfullt att beräkna kvoter och noll betyder att egenskapen saknas.

Exempel kroppslängd.

Om Lisa är 80 cm lång och hennes mamma 160 så är mamma dubbelt så lång. Det är meningsfullt att dividera mammas längd med Lisas och beräkna en kvot.

Om Kalle är 0 cm lång så finns han inte. Nollan betyder avsaknad av egenskapen.

Årtal

Årtal såsom 2010 och 2017 vilken skala mäts de på?

Om vi är intresserade av hur länge sedan det var som Jesus föddes så har vi en kvotskala, för då får noll betydelsen att det är just nu han föds.

Men oftast använder vi dem bara för att sortera in händelser i tiden och mäta hur lång tid det är mellan dem. I så fall blir det en intervallskala.

Page 2: deskriptiv statistik 1 - natskolan.senatskolan.se/course/STA101/lecture/deskriptiv 1.pdfï 3n ylonhq vndod vnxooh yl plwd yduldehoq ´8wrpkxvwhpshudwxu l judghu &hovlxv´ " 1rplqdovndod

2

Respondenters värdering på en numerisk skala ger ordinalskala

Kurslitteraturen var lämplig för att uppnå kursens syfte:

5 4 3 2 1

5 står för håller helt med och 1 för håller inte alls med.

Frågan genererar ordinaldata, man brukar anse att respondenter inte på ett likvärdigt sätt bedömer avståndet mellan 1 och 2 respektive 2 och 3 så vi har inte intervallskala.

Frågan kunde ju också ha formulerats:

Kurslitteraturen var lämplig för att uppnå kursens syfte: Håller helt med Håller delvis med Vet inte har ingen åsikt Håller inte med Håller inte alls med

Exempel på populationer, variabler och skalor.

population variabel Typ av variabel skala

Alla svenska bilar Antalet dörrar

Diskret kvantitativ Kvotskala

färg Kvalitativ Nominalskala

märke Kvalitativ Nominalskala

Alla svenska kvinnor mellan 25 och 35 år

Ålder kroppsvikt

Kontinuerlig kvantitativ(Ålder diskret?)

kvotskala

Yrke Kvalitativ Nominalskala (ordinal?)

Utbildnings-nivå

Kvalitativ(typ av utbildning)Kontinuerlig kvantitativ(antal år)

Nominal, Ordinal

kvotskala

Population Variabel Typ av variabel skala

Sånger iEurovision song contest 2010

Längd Kontinuerlig kvantitativ

Kvotskala

Kvalité (poäng i omröstningen)

Diskret kvantitativ Ordinalskala

Musikstil Kvalitativ Nominalskala

Sjöar i Sverige Storlek (km2) Kontinuerlig kvantitativ

Kvotskala

Vatten temperatur

Kontinuerlig kvantitativ

Intervallskala

djup Kontinuerlig kvantitativ

Kvotskala

Exempel på populationer, variabler och skalor.

På vilken skala skulle vi mäta variabeln ”Din huvudsakliga sysselsättning” ?

Nominalskala

Ordinalskala

Intervallskala

Kvotskala

På vilken skala skulle vi mäta variabeln ”Ålder” ?

Nominalskala

Ordinalskala

Intervallskala

Kvotskala

På vilken skala skulle vi mäta variabeln ”Meningsfullhet” ?

Nominalskala

Ordinalskala

Intervallskala

Kvotskala

Page 3: deskriptiv statistik 1 - natskolan.senatskolan.se/course/STA101/lecture/deskriptiv 1.pdfï 3n ylonhq vndod vnxooh yl plwd yduldehoq ´8wrpkxvwhpshudwxu l judghu &hovlxv´ " 1rplqdovndod

3

På vilken skala skulle vi mäta variabeln ”Utomhustemperatur i grader Celsius” ?

Nominalskala

Ordinalskala

Intervallskala

Kvotskala

Kapitel 2 Tabeller och diagram

Kvalitativa variabler

Frekvens : Antalet observationer för ett visst utfall

Kvantitativa variabler

Frekvens: Antalet observationer som hamnar i ett intervall.

Frekvenstabeller, kvalitativ variabel

Exempel

Vi vill beskriva könsfördelningen hos eleverna i en skola

Kön AntalFlickor 75

Pojkar 65

Totalt 140

Frekvenstabeller, kvalitativ variabel, relativ frekvens

Exempel

Vi vill beskriva könsfördelningen hos eleverna i en skola

Kön AndelFlickor 0,54

Pojkar 0,46

Totalt 1,00

Exempel

Vi vill beskriva könsfördelningen hos eleverna i en skola

Kön ProcentFlickor 54

Pojkar 46

Totalt 100

Frekvenstabeller, kvalitativ variabel, relativ frekvens

flickor

pojkar

Kvalitativa variabler kan illustreras i cirkeldiagram

Page 4: deskriptiv statistik 1 - natskolan.senatskolan.se/course/STA101/lecture/deskriptiv 1.pdfï 3n ylonhq vndod vnxooh yl plwd yduldehoq ´8wrpkxvwhpshudwxu l judghu &hovlxv´ " 1rplqdovndod

4

Kvalitativa variabler kan också illustreras i stapeldiagram

Antal elever

0

20

40

60

80

flickor pojkar

Antal elever

Antal elever

60

65

70

75

80

flickor pojkar

Antal elever

Kvalitativa variabler kan också illustreras i stapeldiagramMan bör undvika brutna staplar då skillnaderna mellan kategorierna överdrivs

Bar Chart and Pie Chart Example

Vilken skala mäts variabeln på?

oNominalskalaoOrdinalskalao Intervallskalaokvotskala

SkiLodges.com is test marketing its new website and is interested in how easy its Web page design is to navigate. It randomly selected 200 regular Internet users and asked them to perform a search task on the Web page. Each person was asked to rate the relative ease of navigation as poor, good, excellent, or awesome. The results are shown in the table below.

Frekvenstabell kontinuerlig variabelKontinuerliga variabler måste klassindelas

Klassintervall: Avståndet mellan klassgränsernaFrekvens: Antal observationer i varje klass.Klassens mittpunkt: Medelvärdet av övre och undre klassgräns.

EXAMPLE – Creating a Frequency Distribution Table

Page 5: deskriptiv statistik 1 - natskolan.senatskolan.se/course/STA101/lecture/deskriptiv 1.pdfï 3n ylonhq vndod vnxooh yl plwd yduldehoq ´8wrpkxvwhpshudwxu l judghu &hovlxv´ " 1rplqdovndod

5

• Markera in alla observationer i de olika klasserna

• Räkna antalet streck i varje klass

Att konstruera en frekvenstabell Relativ frekvens

Grafisk illustration av en kontinuerlig kvantitativ variabels frekvensfördelning

(samt diskreta variabler men många utfall)

• Histogram

• Frekvens polygon

• Kumulativ frekvens polygon

• Boxplot

HistogramHISTOGRAM Ett diagram där klassgränserna anges på den vertikala axeln och frekvensen på den lodräta. Arean på en stapel anger frekvensen. Staplarna ritas intill varandra, utan mellanrum.

Frekvens Polygon

Frekvensen anges genom en punkt mitt över klassmitten och dessa punkter sammanbinds med en linje

Histogram Versus Frequency Polygon• Both provide a quick picture of

the main characteristics of the data (highs, lows, points of concentration, etc.)

• Advantage of the histogram – it depicts each class as a rectangle, with the height of the rectangular bar representing the number in each class.

• Advantage of the frequency polygon - it allows us to compare directly two or more frequency distributions.

Page 6: deskriptiv statistik 1 - natskolan.senatskolan.se/course/STA101/lecture/deskriptiv 1.pdfï 3n ylonhq vndod vnxooh yl plwd yduldehoq ´8wrpkxvwhpshudwxu l judghu &hovlxv´ " 1rplqdovndod

6

Kumulativ frekvens Cumulative Frequency Distribution

Ange vilka av följande diagram som används till kvantitativa variabler

Cirkeldiagram Boxplot Frekvenspolygon Stapeldiagram Histogram

Frekvenstabeller, diskret kvantitativ variabel

Exempel

Vi vill beskriva åldersstrukturen hos eleverna i en skola

Ålder Antal elever, frekvens

Andel elever,

relativ frekvens

7 20 14

8 23 16

9 22 16

10 27 19

11 23 16

12 25 18

n = 140 100

antal elever i olika åldrar

05

1015

202530

7 8 9 10 11 12

Diskreta kvantitativa variabler med ett fåtal olika utfall kan också illustreras i stapeldiagram