Upload
others
View
11
Download
0
Embed Size (px)
Citation preview
Statistika2016/17
Regresiona i korelaciona analiza
Regresiona i korelaciona analiza
Oblik povezanosti između zavisne i nezavisne(ih) promenljive
Jačina povezanosti između promenljivih [kod više od dve promenljive neophodno je definisati zavisnu promenljivu]
Veza između promenljivih može biti •deterministička (funkcionalna) y = f(x)
[podrazumeva perfektno slaganje podataka]•stohastička (statistička)
[slaganje podataka u proseku]
Regresiona i korelaciona analiza
Prosta regresiona i korelaciona analiza: Linearna Krivolinijska
Višestruka regresiona i korelaciona analiza (prostorna povezanost):
Linearna Nelinearna
Prosta linearna regresija i korelacija
"Parametri" proste linearne regresije
• Dijagram rasturanja
• Jednačina regresije
• Standardna greška
Dijagram rasturanja
• Da li postoji kvantitativno slaganje?
• Linearni ili krivolinijski oblik?
• Smer (samo za linearnu vezu)?
Dijagram rasturanja
Pozitivna linearna povezanost Negativna linearna povezanost
Odsustvo kvantitativnog slaganja
Jednačina regresije
Za osnovni skup (cilj): iii xy 10 iii xBAx 212122.1
Za uzorak: ii xbby 10ˆ
212122.1ˆ
ii xbax
y – zavisna promenljivax – nezavisna promenljiva
β0 – presek linije regresije sa ordinatnom osomβ1 – pokazuje za koliko se vrednost zavisne promenljive menja u proseku, ako se nezavisna promenljiva povedaza jednu jedinicuε – slučajna greška
Jednačina regresije
min)ˆ(1
2
n
i
ii yy
Jednačina regresije
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
xbxbyx
xbnby
1
2
1
1
0
1
1
10
1
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
xxxn
yxyxn
b
xbyb
111
2
1111
10
ili
Jednačina regresije
odstupanje
noNeobjašnje
odstupanje
Objašnjeno
odstupanje
Ukupno
m
i
n
j
ii
m
i
n
j
i
m
i
n
j
i
iii
yyyyyy1 1
2
1 1
2
1 1
2 )ˆ()ˆ()(
Standardna greška
Prosečno odstupanje originalnih vrednosti zavisne promenljive od linije regresije.
2
)ˆ(1
2
ˆ
n
yyn
i
ii
y
Prosta linearna regresija i korelacija"Parametri" proste linearne korelacije
• Koeficijent determinacije
• Koeficijent nedeterminacije
• Koeficijent korelacije
• Koeficijent alineacije
22 1 rk
2rr
2kk
*Procenat objašnjenih varijacija zavisne promenljive preko linearne veze]
*Procenat neobjašnjenih varijacija zavisne promenljive preko linearne veze+
*Stepen linearne povezanosti između zavisne i nezavisne promenljive+
*Stepen nepostojanja linearne povezanosti između zavisne i nezavisne promenljive]
10 2 r
11 r
n
i
i
n
i
ii
n
i
i
n
i
i
yy
yy
yy
yy
r
1
1
1
12
)(
)ˆ(
1
)(
)ˆ(
Koeficijent korelacije
2rr
Znak regresionog koeficijenta 1||9,0
9,0||7,0
7,0||5,0
5,0||0
r
r
r
r Slaba korelaciona vezaZnačajna korelaciona vezaJaka korelaciona vezaVrlo jaka korelaciona veza
Zadatak 1Vreme pripreme kolokvijuma u h i broj osvojenih bodova kod 10 na slučajan način izabranih studenata:
Vreme pripreme: 11 14 17 17 20 20 23 26 29 32
Broj bodova: 27 52 49 57 66 58 79 72 89 98
Na osnovu ovih podataka:a) Formirati dijagram rasturanja.b) Odrediti jednačinu linearne regresije za zavisnost broja bodova odvremena pripreme ispita.c) Izračunati standardnu grešku.d) Odrediti parametre proste linearne korelacije.
Zadatak 2Starost automobila u godinama i prodajna cena u stotinama novčanih jedinica kod 8 na slučajan način izabranih vozila:
Starost: 5 6 7 7 8 8 9 10
Cena: 74 82 69 75 71 65 70 54
Na osnovu ovih podataka:a) Formirati dijagram rasturanja.b) Odrediti jednačinu linearne regresije za zavisnost cene od starostivozila.c) Izračunati standardnu grešku.d) Odrediti parametre proste linearne korelacije.
Spirmanov koeficijent korelacije ranga
• Mera povezanosti između rangova podataka
• Veza između originalnih podataka ne mora da bude linearna
• Najčešde se koristi na podacima sa ordinalne merne skale
Kendalov koeficijent konkordacije
• Mera slaganja između rangova podataka (najčešde slaganja između mišljenja ispitanika)