02 predavanja - Statistika

Embed Size (px)

DESCRIPTION

statistika

Citation preview

  • STATISTIKAPREDAVANJA 2013

  • Metodi za izraunavanje:klasini metod*,metod relativnih frekvencija,metod proizvoljnog poetka,metod linearne transformacije obiljeja,metod kumulacije frekvencija.

  • Modus Modus je ona vrijednost obiljeja koja se najee javlja u statistikoj seriji, odnosno ona vrijednost obiljeja koja ima najveu frekvenciju. Zato je modus nekad bolji od aritmetike sredine? Veliina obue ili odjee.Simbol: Mo

  • gdje je:aMo donja granica modalnog intervala,fMo-1 frekvencija prije modalnog intervala,fMo+1 frekvencija poslije modalnog intervala,b irina intervala, irina klase. Modus se moe utvrditi i na osnovu grafikog prikaza! Formula za modus (intervalna numerika serija):U seriji moe da postoji vie modusa!

  • Medijana Medijana je srednja vrijednost po poloaju koja dijeli numeriku seriju na dva jednaka dijela, jedna polovina vrijednosti obiljeja je manja od nje, a druga polovina vea. Simbol: Me

  • Zato je nekad bolje koristiti medijanu nego aritmetiku sredinu?Preduzee ima 6 radnika sa platama:100, 100, 150, 150, 400, 1500m=400Me=150U nekom preduzeu prosjena plata je 400 evra!Primjer:

  • KVARTILIKvartili za negrupisane statistike nizoveelemente napisati redoslijedno (poredati ih po veliini), N/4 element numerikog niza odreuje Q1,3N/4 element numerikog niza odreuje Q3.Xmin Xmax N/4 N/2 3N/4

    Q1MQ3sredinjih 50% jedinica

  • Prvi kvartil (Q1) dijeli numeriku seriju tako da je jedna etvrtina podataka manja od njega a tri etvrtine su vee. Drugi kvartil (Q2) je jednak sa medijanom (Me) i dijeli numeriku seriju tako da je jedna polovina podataka manja od njega a druga polovina vea. Trei kvartil (Q3)

  • Kvartili za negrupisane statistike nizoveDonji kvartil niza rangiranih pojedinanih vrijednosti numerike varijable dat je izrazom:xr se odreuje kada niz nije djeljiv sa brojem 4INT oznaka za cjelobrojni dio razlomka, Na primjer. INT (15:2) + 1 = 7 + 1 = 8INT (15:4) + 1 = 3 + 1 = 4 xr = x4 Q1 je medijan prve polovine statistikog niza.

  • Kvartili za negrupisane statistike nizoveGornji kvartil niza rangiranih pojedinanih vrijednosti numerikog obiljeja:Q3 je medijan druge polovine statistikog niza.

  • Formule za kvartile kad su podaci negrupisani ili grupisani u neintervalnu seriju:

    Neparan broj podataka, prvi kvartil:

    ;

    Neparan broj podataka, trei kvartil:

    ;

    Paran broj podataka, prvi kvartil:

    Paran broj podataka, trei kvartil:

    ;

    _1136968324.unknown

    _1136968329.unknown

    _1136968334.unknown

    _1136968311.unknown

  • Kvartili za statistike nizove grupisane u razrede (Distribucija frekvencija)

    Prvo je potrebno formirati kumulativni niz (na temelju originalnih frekvencija)Prvi kvartil Q1

    N/4 - etvrtina elemenata niza (odreivanje razreda Q1) l1 - donja granica razreda Q1,fi - frekvencija kumulativnog niza "manje od" ispred razreda Q1,fQ1 - originalna frekvencija razreda Q1,i - veliina razreda Q1.

  • Kvartili za statistike nizove grupisane u razrede (Distribucija frekvencija)Trei kvartil Q33N/4 - tri etvrtine elemenata niza (odreivanje razreda Q3), l1 - donja granica razreda Q3,fi - frekvencija kumulativnog niza "manje od" ispred razreda Q3,fQ3 - originalna frekvencija razreda Q3,i - veliina razreda Q3

  • KVANTILIDECILIdijele statistiki niz na 10 jednakih dijelovaima ih ukupno 9Za negrupisane jedinice, kada N nije djeljiv sa 10 bez ostatka:

    Kada je iN/10 cijeli broj, i-ti decil je:

  • DECILI Interpolacijski izraz za odreivanje j-tog decila u inbtervalnim serijama ( grupisani podaci)

  • PERCENTILIdijele statistiki niz na 100 jednakobrojnih dijelovaima ih ukupno 99izrazi za odreivanje percentila identini sugornjim izrazima, sa izuzetkom nazivnika (100, umjesto 10)

  • Interpolacijski izraz za odreivanje j-tog percentila:

  • PrimjerU tabeli su dati rezultati ispitivanja visine linog dohotka stanovnika RS-e.Izraunati:a) kolika je bila prosjena a kolika najea plata?b)medijan i kvartilec) prvi i deveti decild) dvanaesti i sedamdesetosmi percentil

    KM% ispitanikaprave granicedo 7000,1499,5-700,5701-9000,2700,5-900,5901-11002,6900,5-1100,51101-13006,51100,5-1300,51301-150012,31300,5-1500,51501-170016,51500,5-1700,51701-190023,81700,5-1900,51901-210014,91900,5-2100,52101-230011,12100,5-2300,52301-25007,02300,5-2500,52501-30004,22500,5-3000,53001-40000,83000,5-4000,5Ukupno100,0

  • Rjeenje

    (prave granice)KMpixi Pi Xi499,5 700,50,1600,060,00700,5-900,50,2800,5160,00900,5-1100,52,61000,52601,301100,5-1300,56,51200,57803,251300,5-1500,512,31400,517226,151500,5-1700,516,51600,526408,251700,5-1900,523,81800,542851,901900,5-2100,514,92000,529807,452100,5-2300,511,12200,524425,55 2300,5-2500,57,02400,516803,50 2500,5-3000,54,22750,511552,10 3000,5-4000,50,83500,52800,40Ukupno100,0182499,95

  • (prave granice)KMpixiFkmanjod499,5 700,50,1600,00,1700,5-900,50,2800,50,3900,5-1100,52,61000,52,91100,5-1300,56,51200,59,41300,5-1500,512,31400,521,71500,5-1700,516,51600,538,21700,5-1900,523,81800,562,01900,5-2100,514,92000,576,92100,5-2300,511,12200,588,02300,5-2500,57,02400,595,02500,5-3000,54,22750,599,23000,5-4000,50,83500,5100,0Ukupno100,0--

  • Odredimo sredinu i mod

  • c) medijana i kvartili

  • Decili i percentiliInterpolacijski izraz za odreivanje j-tog decila:

    Prvih 10% radnika imalo je platu 1310 KM i manju, a ostalih 90% zaposlenih imalo je platu 1310 KM i veu.

  • PercentiliInterpolacijski izraz za odreivanje j-tog percentila:

  • Mjere varijacija(mjere disperzije)

  • Mjere varijacijaZa prouavanje numerikih serija nije dovoljno prouiti samo srednje vrijednosti serije, nego posmatrati i mjere varijacije koje pokazuju relativna i apsolutna odstupanja vrijednosti obiljeja od aritmetike sredineMjere varijacije su pokazatelji relativnih i apsolutnih odstupanja vrijednosti obiljeja od aritmetike sredine.

  • U statistikoj praksi postoji velik broj mjera varijacije:interval varijacije*,varijansa*,standardna devijacija*,koeficijent varijacije*,normalizovano (standardizovano) odstupanje (z-skor)*,interkvartilna varijacija,srednje apsolutno odstupanje,koeficijent oscilacije,relativno linearno odstupanje,relativni pokazatelj interkvartilne varijacije,relativno kvartilno rastojanje,koeficijent interkvartilne varijacije.

  • Interval varijacije Interval varijacije predstavlja razliku izmeu najvee i najmanje vrijednosti obiljeja. Simbol: I

  • gde je:xmax najvea vrijednost obiljeja,xmin najmanja vrijednost obiljeja,ak gornja granica posljednjeg intervala,a0 donja granica prvog intervala.Formule za interval varijacije:

    Za negrupisane podatke ili neintervalnu seriju:

    Kod intervalne serije:

    _1136969476.unknown

    _1136969494.unknown

  • Interkvartilna varijacijaInterkvartilna varijacija je mjera varijacije koja zanemaruje uticaj ekstremnih vrijednosti obiljeja i pokazuje razliku izmeu prvog i treeg kvartila u numerikoj seriji. IQ = Q3Q1

  • Varijansa Prosjek kvadrata odstupanja pojedinanih vrijednosti obiljeja od aritmetike sredine ili medijane. Simbol: s2 (sigma na kvadrat)Mjera varijacije drugog stepena koja nema jedinicu mjere.Njena vrijednost se nalazi u intervalu [0, +]

  • Formule za varijansu:

    Negrupisani podaci - osnovni skup:

    Negrupisani podaci - uzorak:

    ;

    Grupisani podaci osnovni skup:

    ;

    Grupisani podaci uzorak:

    ;

    _1136970557.unknown

    _1136970558.unknown

    _1136970559.unknown

    _1097504566.unknown

  • Standardna devijacija Prosjeno odstupanje pojedinanih vrijednosti obiljeja od aritmetike sredine, izraeno u jedinicama mjere u kojima je izraeno i obiljeje koje se posmatra. Njena vrijednost se nalazi u intervalu [0, +] Simbol: s (sigma)Mjera varijacije prvog stepena.

  • Formule za standardnu devijaciju:

    Za osnovni skup:

    ;

    Za uzorak:

    .

    _1136971444.unknown

    _1136971448.unknown

  • Koeficijent varijacije Relativna mjera varijacije koja pokazuje koliko procenata iznosi standardna devijacija od aritmetike sredine. Simbol: V

  • Formule za koeficijent varijacije:

    Za osnovni skup:

    ;

    Za uzorak:

    ;

    _1136972205.unknown

    _1136972215.unknown

  • Normalizovano (standardizovano) odstupanje (z-skor) Mjera varijacije koja pokazuje odstupanje jedne vrijednosti obiljeja od aritmetike sredine u standardnim devijacijama.

  • Formule za normalizovano odstupanje:

    Za osnovni skup:

    ;

    Za uzorak:

    .

    _1136972807.unknown

    _1136972812.unknown

    *********Navedene definicije nema kod Milutina. Statistika se ne bavi prevashodno prosecima, kako joj se to pogreno pripisuje, nego mnogo vie odstupanjima od proseka (ili od neke druge zajednike karakteristike), nastojei da otkrije opte karakteristike varijabiliteta posmatranog skupa.

    ****Izmenjena definicija u odnosu na M.St.****Bitno izmenjena definicija u odnosu na M.St.**Ekonomista Alfred Maral je postavio hipotezu da su varijacije veleprodajnih cena vee nego varijacije maloprodajnih jer prodavci u maloprodaji nee tako lako da izgube svoje kupce poveanjem cene. Rezultati istraivanja su pokazali da je Maral u pravu jer je varijansa veleprodajnih cena bila statistiki znaajno vea od varijanse maloprodajnih cena. ****Izmenjena definicija u odnosu na M.St.****