17
Statistika 2016/17 Regresiona i korelaciona analiza

Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Statistika2016/17

Regresiona i korelaciona analiza

Page 2: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Regresiona i korelaciona analiza

Oblik povezanosti između zavisne i nezavisne(ih) promenljive

Jačina povezanosti između promenljivih [kod više od dve promenljive neophodno je definisati zavisnu promenljivu]

Veza između promenljivih može biti •deterministička (funkcionalna) y = f(x)

[podrazumeva perfektno slaganje podataka]•stohastička (statistička)

[slaganje podataka u proseku]

Page 3: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Regresiona i korelaciona analiza

Prosta regresiona i korelaciona analiza: Linearna Krivolinijska

Višestruka regresiona i korelaciona analiza (prostorna povezanost):

Linearna Nelinearna

Page 4: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Prosta linearna regresija i korelacija

"Parametri" proste linearne regresije

• Dijagram rasturanja

• Jednačina regresije

• Standardna greška

Page 5: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Dijagram rasturanja

• Da li postoji kvantitativno slaganje?

• Linearni ili krivolinijski oblik?

• Smer (samo za linearnu vezu)?

Page 6: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Dijagram rasturanja

Pozitivna linearna povezanost Negativna linearna povezanost

Odsustvo kvantitativnog slaganja

Page 7: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Jednačina regresije

Za osnovni skup (cilj): iii xy 10 iii xBAx 212122.1

Za uzorak: ii xbby 10ˆ

212122.1ˆ

ii xbax

y – zavisna promenljivax – nezavisna promenljiva

β0 – presek linije regresije sa ordinatnom osomβ1 – pokazuje za koliko se vrednost zavisne promenljive menja u proseku, ako se nezavisna promenljiva povedaza jednu jedinicuε – slučajna greška

Page 8: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Jednačina regresije

min)ˆ(1

2

n

i

ii yy

Page 9: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Jednačina regresije

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

xbxbyx

xbnby

1

2

1

1

0

1

1

10

1

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

xxxn

yxyxn

b

xbyb

111

2

1111

10

ili

Page 10: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Jednačina regresije

odstupanje

noNeobjašnje

odstupanje

Objašnjeno

odstupanje

Ukupno

m

i

n

j

ii

m

i

n

j

i

m

i

n

j

i

iii

yyyyyy1 1

2

1 1

2

1 1

2 )ˆ()ˆ()(

Page 11: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Standardna greška

Prosečno odstupanje originalnih vrednosti zavisne promenljive od linije regresije.

2

)ˆ(1

2

ˆ

n

yyn

i

ii

y

Page 12: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Prosta linearna regresija i korelacija"Parametri" proste linearne korelacije

• Koeficijent determinacije

• Koeficijent nedeterminacije

• Koeficijent korelacije

• Koeficijent alineacije

22 1 rk

2rr

2kk

*Procenat objašnjenih varijacija zavisne promenljive preko linearne veze]

*Procenat neobjašnjenih varijacija zavisne promenljive preko linearne veze+

*Stepen linearne povezanosti između zavisne i nezavisne promenljive+

*Stepen nepostojanja linearne povezanosti između zavisne i nezavisne promenljive]

10 2 r

11 r

n

i

i

n

i

ii

n

i

i

n

i

i

yy

yy

yy

yy

r

1

1

1

12

)(

)ˆ(

1

)(

)ˆ(

Page 13: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Koeficijent korelacije

2rr

Znak regresionog koeficijenta 1||9,0

9,0||7,0

7,0||5,0

5,0||0

r

r

r

r Slaba korelaciona vezaZnačajna korelaciona vezaJaka korelaciona vezaVrlo jaka korelaciona veza

Page 14: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Zadatak 1Vreme pripreme kolokvijuma u h i broj osvojenih bodova kod 10 na slučajan način izabranih studenata:

Vreme pripreme: 11 14 17 17 20 20 23 26 29 32

Broj bodova: 27 52 49 57 66 58 79 72 89 98

Na osnovu ovih podataka:a) Formirati dijagram rasturanja.b) Odrediti jednačinu linearne regresije za zavisnost broja bodova odvremena pripreme ispita.c) Izračunati standardnu grešku.d) Odrediti parametre proste linearne korelacije.

Page 15: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Zadatak 2Starost automobila u godinama i prodajna cena u stotinama novčanih jedinica kod 8 na slučajan način izabranih vozila:

Starost: 5 6 7 7 8 8 9 10

Cena: 74 82 69 75 71 65 70 54

Na osnovu ovih podataka:a) Formirati dijagram rasturanja.b) Odrediti jednačinu linearne regresije za zavisnost cene od starostivozila.c) Izračunati standardnu grešku.d) Odrediti parametre proste linearne korelacije.

Page 16: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Spirmanov koeficijent korelacije ranga

• Mera povezanosti između rangova podataka

• Veza između originalnih podataka ne mora da bude linearna

• Najčešde se koristi na podacima sa ordinalne merne skale

Page 17: Statistika - ef.uns.ac.rs · Regresiona i korelaciona analiza Oblik povezanosti između zavisne i nezavisne(ih) promenljive Jačina povezanosti između promenljivih [kod više od

Kendalov koeficijent konkordacije

• Mera slaganja između rangova podataka (najčešde slaganja između mišljenja ispitanika)