Uvod Statisticke Metode Istrazivanja

  • Upload
    g5680

  • View
    247

  • Download
    1

Embed Size (px)

Citation preview

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    1/166

    UVOD U STATISTIKEMETODE ISTRAIVANJA

    SNEANA KIRIN

    Statistiki nain miljenja jednog e dana za svakodnevni ivot graanapostati jednako neophodan kao znanje itanja i pisanja

    Herbert George Wells(1866-1946)

    Istorija i filozofija prirodnih nauka i tehnologije

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    2/166

    POJAM I PREDMET

    IZUAVANJA

    Re statistika potie od latinske rei status-stanje

    Predmet prouavanja su masovne, a nepojedinane pojave.

    Na razvoj statistike su znaajno uticali razvojteorije verovatnoe, a u dananje vreme

    raunari i softveri za statistiku.

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    3/166

    ZATO PROUAVATISTATISTIKU? U dananjem informacionom dobu svet je pun

    podataka.

    Postalo je pravilo da moramo usvajati i vrednovati

    znatne koliine podataka (na ije dobijanje se troeogromne koliine novca) ako elimo dobiti kvalitetanuvid u tekui razvoj dogaaja.

    Podacima se mora dati smisao.

    Poslovne odluke se donose u okruenju u komedonosioci odluka nisu sigurni u ponaanje bitnihfaktora u budunosti.

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    4/166

    ETAPE U PROCESUSTATISTIKOGZAKLJUIVANJA

    Izbor obeleja -iskustvenogkaraktera

    Odreivanje uzorka

    Sistematinosreivanje dobijenihvrednosti iz uzorka

    Obrada podataka

    Tumaenje rezultata

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    5/166

    PODELA STATISTIKE: DESKRIPTIVNA I

    INFERENCIJALNA STATISTIKADESKRIPTIVNA STATISTIKA:

    Bavi se opisivanjem prikupljenih podataka dobijenih prilikom ispitivanja

    ili merenja.

    Sreivanje i saimanje podataka kako bi bili to pregledniji.

    (npr. Grafiki prikaz, aritmetika sredina, standardna devijacija)

    INFERENCIJALNA STATISTIKA:

    Slui analizi uzoraka i pronalaenju pravilnosti ili razlika unutar ili meuuzorcima.

    Omoguuje stvaranje zakljuaka (npr. da li se smeju generalizovatizakljuci iz konkretnog uzorka na celu populaciju).

    (npr. hipoteza, otkrivanje veza meu promenljivim, modeliranje odnosa ilislinih postupaka poput analize varijanse, faktorske analize... )

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    6/166

    PODELA STATISTIKE

    VRSTE STATISTIKE

    DESKRIPTIVNA

    grafiki prikazi

    analiza relativnim brojevima

    srednje vrednosti

    mere disperzije

    mere asimetrije i zaobljenosti

    meuzavisnost pojava

    analiza vremenskih serija

    INFERENCIJALNA

    procena karakteristika

    testiranje hipoteza

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    7/166

    UZORKOVANJE

    Teme

    Promenlive(kvalitativne;kvantitativne:diskretne,

    kontinualne)

    Skale za merenje(nominalne, ordinalne,

    intervalne i ratio)

    Jaina istraivanja

    Proces uzorkovanja

    Tipovi uzorkovanja

    Grekeuzorkovanja

    Razliite populacije iz grupe ljudi

    Odnos populacije i uzorka

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    8/166

    Populaciju (statistiki skup) ine jedinice (stvari, osobe, poduzea,proizvodi i sl.) ija su svojstva predmet istraivanja statistikommetodom

    POPULACIJA-STATISTIKI SKUP

    STATISTIKISKUP

    KONAAN

    PREBROJIV NEPREBROJIV

    BESKONAAN REALAN HIPOTETIAN

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    9/166

    Podatakje statistiki izmereni kvalitativni ili kvantitativniatribut po kom su statistike jedinice u skupu sline, a ujedno semeusobno razlikuju.

    Takav atribut (svojstvo) nazivamo statistikim obelejem.Varijable (promenljive)U statistici se varijabla definie sa karakteristikama: Variablaje atribut koji opisuje osobu, mesto, stvar ili ideju.

    Vrednost variable moe varirati od jednog subjekta do drugog.

    Definisanje statistikog skupa

    Pojmovno Prostorno Vremenski

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    10/166

    SKALE MERENJA

    MERNE

    SKALE

    Nominalna Ordinarna Intervalna Ratio Vremenska

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    11/166

    KVALITATIVNE I KVANTITATIVNE

    VARIABLE

    Variable moemoklasifikovati:

    kvalitativne (kategorijske) ili

    kvantitativne (numerike).

    Kvalitativne promenljive uzimaju vrednosti koje predstavljaju imena ilioznake. Na primer, boja lopte (npr. crvena, zelena, plava) ili rasa pasa (npr.

    doga, ovar, terijer) predstavljaju primere kvalitativnih ili kategorijskihvariabli.

    Kvantitativne variable su numerike. One predstavljaju merljivu koliinu.Na primer, kada govorimo o naseljenosti grada, mi govorimo o broju ljudi ugradu - merljiv atribut grada.

    U algebarskim jednainama, kvantitativne variable su prezentovane

    simbolima (na pr. x, y, ili z).

    Varijable

    Kvantitativne

    kontinuirane

    diskretne

    Kvalitativne

    SKALE MERENJA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    12/16612

    Nominalna skala merenja jedino zadovolavasvojstvoidentifikacije.

    Vrednostidodelenepromenlivepredstavlaju opisnukategoriju, ali nema nikakve numerike vrednosti u vezi sa

    veliinom.

    Primeri: polje primerpromenlivekoja se meri na nominalnojskali. Pojedinci mogu biti klasifikovani kao "muko" ili"ensko", ali nijedna vrednost nepredstavlavieili manje "rod"

    od drugog. Religija i politikapripadnost su takodje primerivarijabli koje se obinomere na nominalnoj skali.

    SKALE MERENJA:

    NOMINALNA SKALA MERENJA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    13/16613

    Ordinalna skalaima dva svojstva: identitet i veliinu. Svakavrednost u rednoj skali ima jedinstveno znaenjei ima ureena

    odnos prema svakoj drugoj vrednosti.

    Primer redne skale je rezultat trke Formule 1 gde dobijamo

    identitet i redno mesto uesnikau trci. U ovoj skali se zna ko jeispred koga (ali ne i za koliko, 100m ili 2 kilometra).

    ORDINALNA (REDNA) SKALA

    MERENJA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    14/16614

    I ntervalna skala merenja ima svojstva: identitet, veliina i jednaki

    intervali.

    Primer intervalne skale je Celzijusova skala za merenje temperature.

    Skala se sastoji od jednakih temperaturnih jedinica, tako da je razlika

    izmeu40 i 50 stepeni Celzijusa jednaka razlici izmeu50 i 60stepeni Celzijusa.

    Sa intervalnom skalom se ne zna samo da li su razliitevrednosti veeili manje, vese i takoezna i koliko su one veeili manje. Na

    primer, pretpostavimo da je u ponedeljak bilo 15 stepeni Celzijusa, a u

    utorak 25 stepeni. Zna se, ne samo da je u utorak bilo toplije, zna se da

    je bilo 10 stepeni toplije. Pored toga, nula nepredstavlaapsolutnu najniuvrednost. Umesto

    toga, to je takana skali sa brojevima iznad i ispod nje (na primer, -10stepeni Celzijusa).

    INTERVALNA SKALA MERENJA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    15/16615

    Ratio skala nosi ime po injenici da je merenje procena odnosaizmeuveliinekontinuirane koliineijedinineveliineiste vrste(Michell, 1997, 1999). Skala odnosa poseduje smislenu

    (jedinstvenu i ne-proizvolnu) nultu vrednost.

    Ratio skala zadovolavasve etirisvojstva merenja: identitet,veliinu, jednake intervale i apsolutna nula.

    Primer Ratio skale je teinaobjekta. Svaka vrednost na skaliteineima jedinstveno znaenje, teinese mogu redno prikazati,

    jedinineteinena skali su jednake, a tu je apsolutna nula. Apsolutna nula je svojstvo skale teinejer predmeti u mirovanju

    mogu biti ubesteinskomstanju, ali oni ne mogu imati negativanteinu.

    RATIO SKALA(SKALA MERENJE RAZMERE)

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    16/16616

    SKALE MERENJA

    Nominalna

    Identitet (deskriptivnakategorija)

    Ordinalna

    Identitet i jaina

    Intervalna

    Identitet, jaina i jednakiintervali

    Ratio skalaIdentitet, jaina, jednaki intervalii apsolutna nula

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    17/16617

    Jednodimenzioni podaci. Kada se sprovede studija koja posmatra

    samo jednupromenlivu, kaese da se radi sa univariatnimpodacima.

    Primer: sprovodi se anketa za procenuprosenepotronjegorivarazliitih automobila. Poto se radi samo o jednojpromenlivoj(zapremini), smatra se da se radi sa univariatnim podacima.

    Dvodimenzioni podaci. Kada se sprovodi studija koja istraujeodnos izmeudve varijable, radi se sa bivariatnim podacima.

    Na primer, pretpostavimo da se sprovodi studija sa ciljem da seodredi odnos izmeuteinevozila ipotronjegoriva. Potose radisa dvepromenlive( teinai zapremina), kaese da se radi sa

    bivarijatnim podacima.

    JEDNODIMENZIONI I

    DVODIMENZIONI PODACI

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    18/16618

    UZORKOVANJE

    Teorija uzorkovanjaprouavaodnos izmeuneke populacije iuzorka izvuenogiz nje.

    Takve informacije se zatim

    koriste za procenu parametarakao tosu srednja vrednost

    populacije i varijansa.

    Populacija

    Uzorak

    Uzorkovanje Zakljuivanje

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    19/16619

    Uspenastatistikapraksa se zasniva na fokusiranoj

    definiciji problema. U uzorkovanju, to podrazumevadefinisanje populacije iz koje se uzorak uzima.

    Populacija se moedefinisati kao skup svih ludiiliartikala sa karakteristikom koja se elirazumeti. Zato

    tou praksi veoma retko ima dovolnovremena ilinovca da se prikupe informacije iz svih ili svega upopulaciji, cilpostajepronalaenjereprezentativnoguzorka (ili podskup) od te populacije.

    Uzorkovanje se, kao deo statistikeprakse, baviizborom podskupa pojedinaca iz populacije da se dobijeneko znanje o celoj populaciji, a posebno za potrebeizrade prognoze na osnovu statistikogzakluivanja.

    DEFINICIJA PROBLEMA

    OKVIR UZORKA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    20/16620

    Obinose okvir uzorka postavlja tako da se moeidentifikovati svaki element i ukluiti u uzorak.

    Najjednostavniji tip okvira je spisak elemenata

    populacije (poelnoje cele populacije) saodgovarajuimkontakt informacijama.

    OKVIR UZORKA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    21/16621

    Merljivo svojstvo populacije, kao srednja vrednost ili

    standardna devijacija se zovu parametri populacije, ali

    merljive karakteristike uzorkase zovu statistike.

    Srednja vrednost populacije se oznaava sa; a srednja vrednostuzorka sa .

    Formula za standardnu devijaciju populacije je razliita od

    formule za standardnu devijaciju uzorka.

    POPULACIJA I UZORAK

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    22/16622

    Probabilistiko uzorkovanje Uzorkovanje metodom sluajnog izbora

    Sistematino uzorkovanje

    Stratificirano uzorkovanje Probabilistiko uzorkovanje proporcionalno veliini

    Uzorkovanje klastera

    TIPOVI UZORKOVANJA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    23/16623

    Probabilistiko uzorkovanjeje takvo uzimanje uzorka prikome svaka jedinica u populaciji ima ansu(veu od nule) da

    bude uzeta u uzorak i ta verovatnoa moe da se tano odredi.

    Ovaj nain uzorkovanja je bilo koji metod koji koristi neki oblik

    sluajnogizbora. Da bi imali sluajadnmetod selekcije, potrebno je da se podesi

    proces ili postupak tsko da se osigura da razliitejedinicepopulacije imaju jednake verovatnoe da budu izabrane.

    Ljudi su dugopokuavalida generiurazne oblike sluajnogizbora, kao tosu branje imena iz eira, ilibirajuinajkrauslamku. Ovih dana se koriste kompjuteri kao mehanizam zagenerisanje sluajnihbrojeva i kao osnov za metodu sluajnogizbora.

    PROBABILISTIKO UZORKOVANJE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    24/16624

    Kada svaki element u populaciji ima istu verovatnouselekcije, kae se da je u pitanju"dizajn sa jednakomverovatnoomselekcije(sve izabrane jedinice imaju istu teinu).

    Verovatnoauzorkovanja obuhvata: princip sluajnoguzorka,

    sistematinouzorkovanja, stratifikovano uzorkovanje,uzorkovanje sa verovatnoomproporcionalnoj veliiniuzimanja uzorka, i klaster uzorkovanje.

    Ovi razliitinainiprimene verovatnoeuzorkovanja imaju dve

    zajednikestvari:

    Svaki element ima poznatu verovatnou(veuod 0) i

    Ukluujesluajniizbor u nekom trenutku.

    PROBABILITISTIKOUZORKOVANJE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    25/166

    25

    Uzorkovanje metodom sluajnog izbora je metoduzorkovanja koji ima sledea svojstva:

    Populacija se sastoji od Nobjekata.

    Uzorak se sastoji od nobjekata.

    Svi mogui uzorci od nobjekata su jednako verovatni.Glavna prednost prostog uzorkovanja na sluajan nain je dagarantuje da je izabran uzorak reprezentativan za populaciju. To

    obezbeuje validnost statistikog zakljuivanja.

    UZORKOVANJE METODOM

    SLUAJNOG IZBORA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    26/166

    26

    Princip sluajnoguzorka moebiti ranjiv na grekeuzorkovanja,

    jer sluajnostselekcije moedovesti do toga da neki uzorak neodraavasastav populacije.

    Na primer, jednostavan sluajniuzorak od deset ludiiz nekezemleeu proseku imati pet mukaracai pet ena, ali je

    verovatno da dosta pojedinanihuzoraka imaju vei/manji brojmukaraca/enaod 5. U ciljuprevazilaenjaovog problemakoriste se sistematsko uzorkovanje i stratifikacija.

    Princip sluajnoguzorka takoemoebiti glomazan i naporan

    kada se radi uzorkovanje od neobinovelike populacije.

    U nekim sluajevima, istraivaisu zainteresovani zaistraivakihpitanja specifinaza podgrupe populacije.

    UZORKOVANJE METODOM SLUAJNOGIZBORA - NEDOSTACI

    SISTEMATINO UZORKOVANJE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    27/166

    27

    Sistematino uzorkovanje se sprovodi tako to se elementi

    populacije biraju u odreenim intervalima po utvrenoj emi. Sistematino uzorkovanje ukljuuje sluajan poetaki nastavlja

    izborom svakog sledeeg k-togelementa. Ovde je, broj jedinica uuzorku, k=(veliinapopulacije/veliina uzorka). Vano je da

    poetna taka nije prva na listi, ve se sluajno bira. Jednostavanprimer je biranje svakog10-tog imena u telefonskom imeniku .

    Sve dok je poetna taka sluajna , stematino uzorkovanje je tipprobabiliti uzorkovanja.

    SISTEMATINO UZORKOVANJE

    UZORKOVANJE STRATIFIKACIJOM

    http://en.wikipedia.org/wiki/Probability_samplinghttp://en.wikipedia.org/wiki/Probability_samplinghttp://en.wikipedia.org/wiki/Probability_sampling
  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    28/166

    28

    Kada stanovnitva obuhvata razliite kategorije, one

    se mogu organizovati po tim kategorijama u odvojene"slojeve".

    Svaki sloj je tada odabran kao samostalna sub-populacija, od kojih pojedini elementi mogu biti

    nasumino odabrani. Postoji nekoliko potencijalnihprednosti slojevitog uzorkovanja.

    Uzorkovanje proporcionalno veliini

    Uzorkovanje ija je verovatnoa proporcionalnaveliini se izvodi tako da je verovatnoa izbora svakogelementa proporcionalna njegovoj veliini.

    UZORKOVANJE STRATIFIKACIJOM

    KLASTER UZORKOVANJE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    29/166

    29

    Ponekad je po ceni efektivnije grupisati elemente u groupe

    (klastere') po geografskom principu ili periodu vremena.(Skoro svi uzorci su u nekom smislu klasterisani' u vremenumada se to retko uzima u obzir u toku analize)

    KLASTER UZORKOVANJE

    Grad

    Blok 1 Blok 2 Blok 3

    Zgrada 1 Zgrada 2

    Populacija

    Nivo klastera

    Elementarni nivo

    http://en.wikipedia.org/wiki/Sampling_framehttp://en.wikipedia.org/wiki/Sampling_framehttp://en.wikipedia.org/wiki/Sampling_framehttp://en.wikipedia.org/wiki/Sampling_frame
  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    30/166

    DESKRIPTIVNA

    STATISTIKA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    31/166

    31

    Vana primena deskriptivne statistike je da sumirasakupljene podatke na jasan i razumljiv nain.

    Deskriptivna statistika se primenjuje da opie osnovnasvojstvapodataka koji se analiziraju.

    Zajedno sa jednostavnim grafikim prikazom/analizom, onadaje i osnovnu kvantitativnu analizu podataka.

    Pojam deskriptivne statistike

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    32/166

    MERA CENTRALNE

    TENDENCIJE

    Fundamentalni zadatak u velikom broju statistikih analiza jeodreivanje lokacije i varijabilnosti skupa podataka.

    SREDNJA VREDNOST

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    33/166

    SREDNJA VREDNOSTGlavna deskriptivna (opisna) kvantitativna vrednost izvedena iz

    podataka uzorka je sredina, koja predstavlja aritmetiki prosek

    podataka uzorka. Ona se koristi kao najpouzdanija pojedinanamera vrednosti tipinog lana uzorka.

    Sredina populacije,

    Sredina uzorka= gde

    o Xje suma svih obeleja populacije.o Nje broj obeleja populacije.o xje suma obeleja uzorkai nje broj obeleja u

    uzorku.

    Kada statistiari govore o sredini populacije koriste grkoslovo . Kada govore o sredini uzorka koriste oznaku

    .

    MEDIJANA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    34/166

    MEDIJANA

    Ako uzorak sadri nekoliko vrednosti koje su toliko velike ilitoliko male da imaju iskrivljujui efekat na vrednost sredine, onse moe predstaviti tanije korienjem medijane vrednostikoja sve vrednosti uzorka deli na dve jednake polovine.

    Postupak odreivanja mediane posmatrana obeleja seporeaju od najmanje do najvee vrednosti . Za neparan brojopservacija, mediana je srednja vrednost. Za paran broj

    opservacija mediana je sredina dve srednje vrednosti:

    NEPARAN BROJ OPAANJA :

    MEDIANA=(N+ 1)/2

    PARAN BROJ OPAANJA:

    MEDIANA= [(N/2) + ((N/2) +1)]/2

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    35/166

    MOD

    Mod je vrednost koja se najee pojavljuje u skupupodataka.

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    36/166

    PRIMER 1

    Pretpostavimo da imamo uzorak od 5-oro dece imerimo njihovu visinu. Izmerene visine su:

    100 cm, 100 cm, 130 cm, 140 cm i 150 cm.

    Vrednost mediane je130 cm; jer imamo 5posmatranja, a 130 cm je srednja visina;

    Srednja visina= (100 + 100 + 130 + 140 + 150)/5 =

    620/5 = 124 cmMod=100 cm (dva puta)

    Sredina nasuprot mediani

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    37/166

    Sredina nasuprot mediani

    Svaka od njih ima prednosti i nedostatke:

    Medijana moe biti bolji pokazatelj tipinevrednosti u sluaju kada imamo ekstremne

    izuzetke.

    Meutim, kada imamo veliki uzorak koji neukljuuje izuzetke,srednja vrednost pokazuje

    bolju meru centralne tendencije.

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    38/166

    PRIMER 2

    Ilustracija: Pretpostavimo da posmatramo

    uzorak od 10 porodica i zanima nas tipiniprihod porodice. Devet porodica imaju prihod

    izmeu 50.000 and 100.000 din; ali deseta imameseni prihod od 1.000.000 din. Desetaporodica je ekstremna vrednost (izuzetak). Ako

    mi procenjujemo prihod tipinog domainstvaonda e srednja vrednost znatno premaivatiprihod tipinog domainstva, a medijana nee.

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    39/166

    MERENJE DISPERZIJE

    Koliine najee koriene za merenje rasipanja(disperzije) vrednosti oko njihove sredine su varijansa 2i njen kvadratni koren, standardna devijacija .

    Varijansa se izraunava odreivanjem sredine, njenimoduzimanjem od svake vrednosti u uzorku (to dajeodstupanje-devijaciju uzoraka), a potom nalaenjem

    proseka kvadrata ovih odstupanja.

    VARIJANSA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    40/166

    VARIJANSA

    U populaciji , variansaje srednje kvadratno odstupanje od sredine

    populacije definisana formulom :

    gde je 2variansa populacije, je srednja vrednost populacije, Xije

    i-ti element populacije i N je broj elemenata populacije.

    Varijansa uzorka se definie neto drugaijom formulom :

    gde je s varijansa uzorka, je sredina uzorka, je i-ti element izuzorka i nje broj elemenata u uzorku. Formula za varijansu uzorka

    moe da se posmatra kao nepristrasna procena varijanse pop ulacije.

    2= ( Xi- )2/ N

    s2= ( xi- )

    2/ ( n - 1 )

    STANDARDNA DEVIJACIJA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    41/166

    STANDARDNA DEVIJACIJA

    Standardna devijacija populacijeje kvadratni koren izvarianse:

    ()

    gde je standardna devijacija populacije, 2je varijansa

    populacije, je srednja vrednost populacije,

    je i-ti

    elemenat populacije i N je broj elemenata u populaciji.

    Standardna devijacija uzorkaje:

    ( )

    1

    gde jes- standardna devijacija,s2je variansa uzorka, je

    sredina uzorka, je i-ti element uzorka i nje brojelemenata u uzorku.

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    42/166

    SREDNJA VREDNOST I

    STANDARDNA DEVIJACIJA

    Sredina i standardna devijacija uzorka koriste se kao

    procene odgovarajuih karakteristika celokupnegrupe iz koje je uzorak izvuen.

    GRAFIKI PRIKAZ KUMULATIVNE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    43/166

    GRAFIKI PRIKAZ KUMULATIVNEFREKVENCIJE

    Grafikiprikaz kumulativne frekvencijejenainda sese prikau kumulativne informacije grafiki. On

    prikazuje broj, procenat ili proporciju elemenataposmatranog skupa koja je manja ili jednaka nekoj

    vrednosti.

    Primer: U skupu podataka kumulativna frekvencijaza vrednostx je ukupan broj zbirova koji su manji ili

    jednaki x. Slika na sledeem slajdu ilustruje razlikuizmeu frekvencije i kumulativne frekvencije. Obagrafa pokazuju zbirove testa za 300 studenata.

    PRIMER 3

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    44/166

    PRIMER 3

    Visine kolona levog grafa, pokazuju frekvenciju - brojstudenata u svakoj grupi po rezultatu u testiranju. Npr.,oko 30 studenata je dobilo izmeu51 i 60 poena natestu.

    Visine kolona desnog grafa pokazuju kumulativnufrekvencijubroj studenata do svakog zbira poena kojise posmatra. On pokazuje da je 30 studenata dobilo natestu do 50 poena; 60 studenata je dobilo rezultat do 60

    poena; 120 studenata je dobilo rezultat do 70poena itd.

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    45/166

    APSOLUTNA NASUPROT RELATIVNOJ

    FREKVENCIJI

    Frekvencija se moemeriti apsolutnim ili

    relativnim brojevima

    (proporcija-gornji

    graf ili procenat-

    donji graf).

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    46/166

    DISKRETNA PROMENLJIVA-

    VARIJANSA

    Za diskretnu varijablu Xvarijansa je data izrazom:

    k

    iii xpxXE 1

    222

    )()()(

    k

    iii xpx1

    222

    )(

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    47/166

    KONTINUALNE PROMENLJIVE

    Ovde graf prikazujekumulativni graf kontinualne

    promenljive na X osi

    Odredjivanje mediane:

    Posmatra se linija koja ide odY ose za 50%. Ta linija seekrivu nad X osom (vrednostzbira testa) za vrednost 73. Toznai da je polovina studenata

    dobila rezultat testa do 73poena i polovina najmanje 73poena.

    Prema tome, mediana je 73.

    DESCRIPTIVNE STATISTIKE ANALIZE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    48/166

    DESCRIPTIVNE STATISTIKEANALIZEDescriptivne statistikeanalize predstavljaju skup metoda koji sekoriste za prikaz i opis osnovnih karakteristika statistikog skupa.

    Odreivanje osnovnih statistikih indikatora ukljuuje:

    1. Grupisanje i sortiranje podataka.2. Prikaz statistika.

    3. Odreivanje osnovnihindikatora statistikihserija.

    Grupisanje podataka se vri prema vrednosti ili modalitetu koji seistrauje.

    Prikazivanje statistikihserija moe biti uraeno na dva naina: tabelarno. grafiki.

    SIMETRIJA I SPLJOTENOST

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    49/166

    SIMETRIJA I SPLJOTENOST(SKEWNESS AND KURTOSIS)

    Skewnessje mera simetrije ili, preciznije, nedostataksimetrije. Distribucija skupa podataka je simetrina ako izgledaisto levo i desno od centralne vrednosti.

    Kurtosisje mera da li su podaci otrije ili spljotenije

    rasporeeni u odnosu nanormalnu distribuciju.To znai da skup podataka kod koga je kurtosis veliki imaznaajanpikblizu srednje vrednosti, naglo opadajui i ima dugerepove.

    Skup podataka sa malim kurtosisom ima ravan vrh blizu sredine.(Uniformna distribucija je ekstreman sluaj).

    SKEWNESS

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    50/166

    SKEWNESS

    Za skup podataka Y1. Y2. .... YN, formula for

    skewness je:

    ( )=

    (1)

    gde je srednja vrednost, sje the standardna devijacija iNje brojelemenata. Skewness za normalnu distribucijuje nula i svaki simetrian skup

    podataka ima skewness blizu nule.

    Negativne vrednosti za skewness ukazuju podatke koji su

    iskrivljeni nalevo, a pozitivne vrednosti za skewness ukazuje dasu podaci iskrivljenina desno.

    Iskrivljenost na levo znai da je levi rep dui u odnosu na desni.Slino,iskrivljenost na desno znai da je desni reprelativno dui u

    odnosu na levi.

    http://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htm
  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    51/166

    KURTOSIS

    ( )=(1)

    Gde je

    srednja vrednost, s je standardna devijacija iNje

    broj podataka. Kurtosis za standardnu normalnu distribuciju

    je 3. Iz tog razloga, neki analitiari koriste sledeudefiniciju za kurtosis :

    ()

    () -3

    http://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htmhttp://itl.nist.gov/div898/handbook/eda/section3/eda3661.htm
  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    52/166

    KURTOSIS

    Ta definicija se koristi sa ciljem da oznai dastandardna normalna distribucija ima kurtosis

    nula.

    U tom sluajupozitivan kurtosis ukazujedistribuciju sa pikom, anegativan kurtosisukazuje da se radi o ravnijoj distribuciji.

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    53/166

    PRIMERI ZA SKEWNESS I KURTOSIS:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    54/166

    SKEWNESS

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    55/166

    Primer 4-tabela

    Broj ispita (X) Broj studenata (fi)

    0-2 10

    3-5 20

    6-8 15

    9-11 12

    posmatrano svojstvo Frekvencija (fi),

    X- kvalitativna strana kvantitativna strana tabel

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    56/166

    TIPOVI GRAFOVA:

    Grafovi se obino delena: Skater (Scatter) Stubiasti (Bar)

    Linijski (Line diagram)Pita- graf (Pie chart)

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    57/166

    SKATER GRAF

    Number of exams

    0

    5

    10

    15

    20

    25

    0 2 4 6 8 10 12

    Number of students

    Number of students

    B dij

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    58/166

    Bar dijagram

    0

    5

    10

    15

    20

    25

    0-2 3-5 6-8 9-11

    Broj studenata (fi)

    Number of students (fi)

    U Excelu

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    59/166

    59

    U Excelu

    Broj ispita Broj studenata

    1 10

    4 207 15

    10 12

    umber of exam Number of students

    Mean 5,5 Mean 14,25Standard Error 1,936491673 Standard Error 2,174664725

    Median 5,5 Median 13,5

    Mode #N/A Mode #N/A

    Standard Devi 3,872983346 Standard Devia 4,34932945

    Sample Varian 15 Sample Varianc 18,91666667

    Kurtosis -1,2 Kurtosis -0,036561936

    Skewness 0 Skewness 0,829536957

    Range 9 Range 10

    Minimum 1 Minimum 10Maximum 10 Maximum 20

    Sum 22 Sum 57

    Count 4 Count 4

    PRIMER5

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    60/166

    PRIMER5

    MesecBroj turista (uhiljadama)

    Januar 20

    Februar 18

    Mart 21

    April 35

    Maj 40

    Jun 95

    Jul 75

    Avgust 78Septembar 41

    Octobar 45

    Novembar 34

    Decembar 18

    Broj turista(u hiljadama)

    January

    February

    March

    April

    May

    June

    July

    August

    September

    October

    November

    December

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    61/166

    LINIJSKI DIJAGRAM

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    100

    Broj turista (u hiljadama)

    Number of tourists (in thousands)

    POLARNI DIJAGRAM (TIP LINIJSKOGDIJAGRAMA)

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    62/166

    DIJAGRAMA)

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    100

    January

    February

    March

    April

    May

    June

    July

    August

    September

    October

    November

    December

    Series1

    PITA GRAF

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    63/166

    PITA GRAF

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    64/166

    PRIMER: SREDNJA VREDNOST (EXCEL)

    MesecBroj turista(u hiljadama)

    Januar 20

    Februar 18

    Mart 21

    April 35

    Maj 40

    Jun 95

    Jul 75

    Avgust 78

    Septembar 41

    Oktobar 45

    Novembar 34

    Decembar 18

    Sum 520

    The mean 43,33333333

    The mean 43,33333333

    Srednja vrednost= (xi)/n

    =520/12= 43.3

    Srednja vrednost =

    Average(b2:b12)=43.3

    Minimum=min(b2:b12)=18

    Maximum=max(b2:b12)=92

    Range=Maximum-minimum=77

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    65/166

    65

    Histogram in Excel:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    66/166

    66

    Output

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    67/166

    PRIMER: MEDIANA

    MonthsNumber of tourists(in thousands)

    December 18

    February 18

    January 20

    March 21

    November 34

    April 35

    May 40

    September 41

    October 45

    July 75August 78

    June 95

    Sortira vrednosti

    prema veliini

    Mediana=

    (f6+f7)/2=(35*40)/2

    =37.5

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    68/166

    VARIANSA I STANDARDNA DEVIJACIJA

    Mesec

    Broj turista

    (u hiljadama)

    (Xi-Xaverage)**2

    Januar 20 544,4444444

    Februar 18 641,7777778

    Mart 21 498,7777778

    April 35 69,44444444

    Maj 40 11,11111111

    Jun 95 2669,444444Jul 75 1002,777778

    Avgust 78 1201,777778

    Septembar 41 5,444444444

    Oktobar 45 2,777777778

    Novembar 34 87,11111111

    Decembar 18 641,7777778Sum 520 7376,666667

    The mean 43,33333333

    The mean 43,33333333

    Variance 670,6060606

    StDev 25,89606265

    Variance=

    Sum(Xi-Xsr)**2/(n-1)

    Or

    Excel function

    Var(x1:x12)=

    670.606

    StDev=SQRT(Varian

    ce)

    or

    Excel function:

    STDEV(x1:x12)=25.89606265

    EXCEL REZULTATI ZA PRIMER 5

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    69/166

    EXCEL REZULTATI ZA PRIMER 5:

    DATA ANALYSIS. DESCRIPTIVE STATISTIC

    Months

    Number of tourists

    (in thousands)

    January 20

    February 18

    March 21

    April 35May 40

    June 95

    July 75

    August 78

    September 41October 45

    November 34

    December 18

    Number of tourists (in thousands)

    Mean 43.33333333

    Standard Error 7.47554937

    Median 37.5

    Mode 18

    Standard Deviation 25.89606265

    Sample Variance 670.6060606

    Kurtosis -0.193982443

    Skewness 0.964520362

    Range 77

    Minimum 18Maximum 95

    Sum 520

    Count 12

    Confidence Level(95,0%) 16.45357323

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    70/166

    SKEWNESS AND KURTOSIS (IN EXCEL)

    Skewness = SKEW(B2:B13)= 0.964520362

    Pozitivna vrednost za skewness ukazuje da su podaci zakrivljeni

    udesno.

    Kurtosis = Kurt(B2:B13)= -0.193982443

    Prema drugoj definiciji (normalna distribucija ima=0 negativni

    kurtosis ukazuje zaravljenu" distribuciju.)

    Standard error = StdDev/Sqrt(12)= 25.89606264678/ 3.46410161

    = 7.4755493700355

    Raspodele verovatnoe

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    71/166

    71

    Raspodela kontinuirane

    verovatnoe

    Binomna

    Hipergeometrijska

    Poisson-ova

    Raspodeleverovatnoe

    Raspodela diskretne

    verovatnoe

    Normalna

    Uniformna

    Eksponencijalna

    Raspodele verovatnoe

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    72/166

    DISKRETNE SLUAJNE PROMENLJIVESluajne promenljive (promenljiva koja poprima numerike vrednostiodreene ishodima sluajnog eksperimenta)

    Teme:

    Oekivana vrednost diskretne sluajne promenljive Varijansa

    Binomna distribucija

    Poasonova distribucija

    Kovarijansa i korelacija

    NORMALNA RASPODELA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    73/166

    Normalna gustina raspodele verovatnoe:

    2)(

    21

    2

    1)(

    x

    exf

    NORMALNA RASPODELA

    Normalna raspodela je

    potpuno odreena sa: -srednja vrednost

    -standardna devijacija

    Nain zadavanja:

    N(, 2)

    OSOBINE NORMALNE RASPODELE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    74/166

    OSOBINE NORMALNE RASPODELE

    zvonastog oblika simetrina

    unimodalna

    asimptotska

    srednja vrednost, medijana i

    mod su jednaki

    Raspodelu definiu srednjavrednost, , i standardna devijacija,.

    Srednja vrednost definie centar, astandardna devijacija irinu.

    OSOBINE NORMALNE RASPODELE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    75/166

    OSOBINE NORMALNE RASPODELE

    Standardna devijacija je rastojanjeod srednje vrednosti do take gdekriva menja oblik od konkavne nadole u konkavnu na gore

    IZGLED NORMALNIH RASPODELA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    76/166

    IZGLED NORMALNIH RASPODELA

    Promenom parametara i , dobijaju se razliite normalne raspodele

    PRIMERI PODATAKA SA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    77/166

    PRIMERI PODATAKA SA

    NORMALNOM RASPODELOM

    oekivani ivotni vek ljudi u populaciji

    visina

    teina

    visina plata broj pacijenata na koji propisani lek deluje

    podaci iz proizvodnje

    IQ

    dr.

    GRAFIK NORMALNE RASPODELE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    78/166

    GRAFIK NORMALNE RASPODELE

    STANDARDIZOVANO ODSTUPANJE(Z SCORE)

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    79/166

    (Z-SCORE)

    z-scoreje razlika izmeu posmatrane vrednosti i

    srednje vrednosti podeljena sa standardnomdevijacijom

    To je odstupanje posmatrane vrednosti od srednjevrednosti izraeno u broju standardnih devijacija

    Na primer: ako je z = 2, vrednost X je udaljena 2standardne devijacije od srednje vrednosti.Ako je -3,0 > z-score > 3,0

    vrednost z-score se smatra ekstremnom

    STANDARDIZOVANO

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    80/166

    ODSTUPANJE , Z-SCORE

    Primer: Prosean unos proteina 77 g/dan, standardna devijacija, Sd =8 g, N = 500

    Gde se nalazi osoba koja unosi 93 g/dan ?

    28

    16

    8

    7793z

    Osoba koja unosi 93 g/dan ima vrednost koja je za 2 Sd vea odprosenog unosa proteina

    Negativan z-score znai da je vrednost manja od srednjevrednosti

    STANDARDIZOVANA NORMALNA

    RASPODELA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    81/166

    RASPODELA

    standardizovana normalna kriva je simetrinaoko nulenajveideopovrineispod krive leiizmedju -3z i 3zpovrinaispod standardne normalne krive je 1

    krajevi krive se asimptotskipribliavajux-osi

    standardizovana

    normalna kriva

    z-score je normalno distribuiran sa srednjom vrednou

    0 i standardnom devijacijom 1

    standardizovana normalna raspodela

    = 0

    = 1 0 1

    PRIMER

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    82/166

    PRIMER

    Ako je varijabla x normalno distribuirana sa srednjomvrednou = 5i standardnom devijacijom = 2,

    z vrednost za x = 6,2je

    Ovo znai da se vrednost x = 6,2 nalazi 0,6 standardnih

    devijacija (0,6 inkrementa od 2 jedinice) iznad srednjevrednosti

    6,02

    52,6xz

    PRIMER

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    83/166

    6,02

    52,6x

    z

    Normalna raspodela Standardizovananormalna raspodela

    6,2 x 0,6

    = 2 z= 1

    = 5 z= 0

    z

    PRIMER

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    84/166

    25,12

    55,7xz25,12

    55,2xz

    Normalna raspodelaStandardizovana

    normalna raspodela

    x z

    = 2 z= 1

    = 5 z= 0

    2,5 7,5 -1,25 1,25

    NALAENJE VEROVATNOE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    85/166

    NALAENJE VEROVATNOE

    Verovatnoa jepovrina ispod krive!

    c d x

    f(x)

    ?P c X d

    VEROVATNOA KAOPOVRINA ISPOD KRIVE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    86/166

    POVRINA ISPOD KRIVE

    Ukupna povrina ispod krive je1,0

    Raspodela je simetrina

    f(x)

    x

    0,50,5

    1,0)xP(

    0,5)xP( 0,5)xP(

    TABELA STANDARDIZOVANE NORMALNE RASPODELE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    87/166

    TABELA STANDARDIZOVANE NORMALNE RASPODELE

    Tablica standardizovane normalne raspodele dajeverovatnou, odnosno povrinu za vrednosti manje odeljene vrednosti z (od - do z)

    primer:

    P(z < 2,00) = 0,9772 0.9772

    z0 2,00

    TABELA STANDARDNE NORMALNE

    RASPODELE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    88/166

    RASPODELE

    Verovatnoa/povrinazavrednosti manje z manje odeljene vrednosti z

    0,9772

    2.0P(z < 2,00) = 0,9772

    U redovima su vrednosti

    z do prvog decimalnog

    mesta

    U kolonama su vrednosti z na

    drugom decimalnom mestu

    2,0

    .

    .

    .

    Z 0,00 0,01 0,02

    0,0

    0,1

    VANE POVRINE ISPOD KRIVE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    89/166

    VANE POVRINE ISPOD KRIVE

    Povrina izmeu -1z i +1z = 0,6826 = 68,3%Verovatnoa da se varijabla x nae u granicama jednestandardne devijacije ili -1z i +1z je 68,3%

    P = 0,6826 = 68,3%

    VANE POVRINE ISPOD KRIVE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    90/166

    VANE POVRINE ISPOD KRIVE

    U rasponu je

    68,3%povrine ispod krive, odnosno

    68,3% svih vrednosti

    f(x)

    x +1-1

    68,26%

    VANE POVRINE ISPOD KRIVE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    91/166

    Povrina izmeu -2z i +2z =

    0,9544 = 95,4%

    Verovatnoa da se varijabla xnae u granicama -2z i +2z :P = 0,9544 = 95,4%

    Povrina izmeu -3z i +3z =

    0,9974 = 99,7%

    Verovatnoa da se varijabla xnae u granicama -3z i +3z :P = 0,9974 = 99,7%

    VANE POVRINE ISPOD KRIVE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    92/166

    x

    2 2

    95.44%

    +2-2x

    3 3

    99.73%

    -3 +3

    U rasponu 2 je

    95,4%povrine ispodkrive

    95,4% svih vrednosti

    U rasponu 3 je

    99,7%povrine ispodkrive

    99,7% svih vrednosti

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    93/166

    DISTRIBUCIJE UZORAKA

    Za odnos standardne devijacije osnovnog skupa i standardnedevijacije distribucije uzoraka vai izraz:

    Navedena relacija o odnosu standardne devijacije distribucijeuzoraka i standardne devijacije osnovnog skupa vai zabeskonane osnovne skupove i za konane skupove sponavljanjem.

    Izraz za standardnu greku procene aritmetike sredine zakonane skupove je:

    nx

    1

    N

    nN

    nx

    TEORIJA MALIH UZORAKA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    94/166

    TEORIJA MALIH UZORAKA

    esto se koristi injenica da se uzorci veliineN>30,nazivaju velikim, a distribucija velikog broja statistika je

    aproksimativno normalna i pribliavanje normalnojdistribuciji je bolje kako N raste.

    Za uzorke veliineN

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    95/166

    U verovatnoi i statistici, Studentova t-raspodela (ili jednostavno t-distribucija) sa (n-1) stepeni slobode , t(n-1), je neprekidna raspodelaverovatnoa koja nastaje kada se procenjuje srednja vrednostnormalno distribuirane populacije u situacijama gde je uzorak mali istandardna devijacija populacije, , je nepoznata.

    Ako = s, t = Z, T distribucija postaje normalna raspodela. Kao Nraste, Studentova distribucija se pribliava normalnoj raspodeli.

    Studentova raspodela se moe izvesti transformacijom Studentovez-raspodele koristei i zatim definisanjem

    t-raspodelaje simetrina i u obliku zvona, kao normalnadistribucija, ali ima vee repove, to znai da je vie sklona da

    proizvodi vrednosti koje padaju daleko od svog proseka. To je inikorisnim za razumevanje statistikog ponaanje pojedinih vrstaodnosa sluajnih veliina, u kojima su varijacije u imeniocu vee imoe se desiti da se pojave ekstremne vrednosti u sluajevima kadaimenilac pada blizu nule.

    PRIMENA STUDENTOVE RASPODELESt d t d l i l i i k k i ih t ti tikih

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    96/166

    Studentova raspodela igra vanu ulogu u nizu iroko korienih statistikihanaliza:

    za procenu statistike znaajnosti razlike izmeu srednjih vrednosti dvauzorka,

    za konstrukcija intervala pouzdanosti za testiranje razliku izmeusrednjih vrednosti dve populacije, i u analizama linearne regresije.

    PROCENA PARAMETARA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    97/166

    PROCENA PARAMETARA

    OSNOVNOG SKUPA

    Procenjivanje nepoznatih parametara osnovnog skupa zasniva se napodacima koji predstavljaju sluajan uzorak i na izraunavanjuodgovarajue statistike uzorka.

    Parametri se mogu proceniti brojem i intervalom.

    Izraunata vrednost statistike uzorkaje procena parametra brojem, aprocena intervalom se sastoji u odreivanju granica raspona varijacijeukojem se prema nekom kriteriju oekuje da e biti vrijednost nepoznatog

    parametra.

    PROCENA PARAMETARA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    98/166

    PROCENA PARAMETARA

    OSNOVNOG SKUPA

    Interval procene aritmetike sredine se odreuje kaointerval vrednosti oko aritmetike sredine uzorka.

    irina ovog intervala zavisi od pouzdanosti procene ioblika sampling distribucije aritmetikih sredinauzoraka.

    Sampling-distribucija aritmetikih sredina uzorakaodreene veliine ima normalan oblik (Centralnagranina teorema).

    12121 xx zxzxP

    PROCENA PARAMETARA

    OSNOVNOG SKUPA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    99/166

    OSNOVNOG SKUPA

    Standardna grekaprocene aritmetike sredine je funkcijaveliine uzorka. Za poznatu vrednost standardne devijacijeosnovnog skupa, ona iznosi .

    U praksi uglavnom nije poznata standardna devijacija

    osnovnog skupa, ve se ona procenjuje pomou standardnedevijacije uzorka.

    Izraz za nepristrasnu procenu varijanse je:

    nx

    1

    1

    2

    2

    n

    xxS

    n

    i

    i

    PROCENA PARAMETARA OSNOVNOG SKUPA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    100/166

    PROCENA PARAMETARA OSNOVNOG SKUPA

    Procenjena vrednost standardne greke je

    Standardizovana vrednost tima oblik tzv. Studentove ili T-

    distribucije sa (n-1) stepena slobode.

    Za velike uzorke sampling distribucija se moe aproksimiratinormalnom distribucijom

    nSSx xS

    xt

    )1()( 2121 xx SzxSzxP

    )1()( )1;2()1;2( xnxn StxStxP

    SREDNJE VREDNOSTI

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    101/166

    UZORAKA I POPULACIJE

    Ako posmatramo sve mogue uzorke veliine n iz populacije od Njedinica i ako za svaki uzorak izraunamo srednju vrednostiposmatramo distribuciju tako dobijenih srednjih vrednosti.

    + + .

    =

    Moe se pokazati da je aritmetika sredina te distribucije (sredinauzoraa) jednaka aritmetikoj sredini osnovnog skupa

    =

    CENTRALNA GRANINA TEOREMA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    102/166

    CENTRALNA GRANINA TEOREMA

    Neka je X1, X2, , Xn sluajan uzorak uzet izproizvoljne distribucije sa srednjom vrednouivarijansom 2

    Ako nide u beskonanost, distribucija uzoraka oblika

    konvergira ka N(0,1) distribuciji.

    KONCEPCIJA TESTIRANJA HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    103/166

    Nulta i alternativna hipoteza

    Testiranje sredine normalne distribucije u sluaju poznate varijansepopulacije

    Interpretacija vrednosti verovatnoe ili p-vrednosti

    Testiranje sredine normalne distribucije u sluaju nepoznate varijanse

    Testiranje hipoteza proporcijskog udela u

    populaciji (veliki uzorak)

    Primeri

    NULTA I ALTERNATIVNA HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    104/166

    Kod svakog problema koji se razmatra, obinose mogu pojednostavlenoformulisati dve suprotstavlenetvrdnje (hipoteze):

    Nulta hipoteza, oznaujese sa H0, i

    Alternativna hipoteza, oznaenasa H1.

    Ove dve konkurentske tvrdnje( hipoteze) se meutimne tretiraju ravnopravno,vese: posebna panja posveujenultoj hipotezi.

    Uobiajena je situacija: Eksperiment se sprovodi u pokuajuda se opovrgne ili

    odbaci odreenunultu hipotezu tako da se njoj daje prioritet u smislu da se onane moe odbaciti ukoliko dokazi protiv nje nisu dovolnojaki.

    Na primer,

    H0: nema razlike u ukusu izmeunormalnog i Diet Coca Cole

    H1: postoji razlika.

    Ako je jedna od dva tvrdnje "jednostavnija" njoj se obinodaje prioritet, tako dase "komplikovanija" teorija ne usvaja ukoliko nema dovolnodokaza protiv

    jednostavnije.

    Na primer, "jednostavnija" je tvrdnja da nema razlike u ukusu izmeuobineidijet Coca Cole i tvrdnje da postoji razlika.

    VRSTE HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    105/166

    Moemo rei da postoje 2 vrste hipoteza:

    1.Hipoteze koje se odnose na raspodele obeleja nazivaju se neparametarskehipoteze

    paramerarske hipotezeodnose na karakteristine parametre populacijekao tosu oekivanavrednost i varijansa.

    Primer:

    Ako naprimer bacamo kocku 1000 puta i ako se 6 pojavi 185 puta ,parametarska hipoteza bi bila da je

    neparametarska hipoteza bi bila da se verovatnoepojave odreenogbroja

    rasporeujupo binomnoj raspodeli

    1

    6p

    , ,

    1, 1000, 185,

    6

    1 n kk

    n k p

    p n k

    nP p p

    k

    PARAMETARSKE I NEPARAMETARSKE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    106/166

    HIPOTEZE

    Primer parametarske hipoteze:

    H0: oekivanavrednost visine deset godina starih deakau srpskojpopulaciji nije drugaija od oekivanevrednosti visine deset godinastarih devojica.

    H1: postoji razlika u oekivanoj vrednosti visine deset godina starihdeakai devojica u srpskoj populaciji.

    Primer neparametarske hipoteze:

    H0: Visina deset godina starih deakaje normalno distribuirana usrpskoj populacijii.

    H1:Visina deset godina starih deakanije normalno distribuirana usrpskoj populacijii.

    ISHOD TESTIRANJA HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    107/166

    Ho, polazna-nulta i H1, suprotna-alternativna.

    Hipoteza moeda bude pogrenai tana.

    Zato se postavljene hipoteze podvrgavaju se statistikom proveravanju, testiranju,verifikaciji, pomou koga se donose odluke, da li sa odreenom verovatnoom,hipoteze se prihvataju ili odbacuju.

    Savremenu teoriju verifikacije dali su Nejman i Pirson (1928,1933 )

    Ishod testiranja hipoteza moe biti:1. "Odbaci H0 u korist H1(kao posledicu eksperimenta na uzorku i prihvatamo

    H1) ili

    2. Ne odbaci H0 (jer nema dokaza protiv nje).

    Primer:

    Ako je proizvodja lansirao na trite nov proizvod, on mora da dokae da jenjegov proizvod bolji od postojeih.

    Polazna hipoteza Ho je da je novi proizvod najbolj i, i da bi dokazao tu hipotezu, onmora da obori suprotnu, alternativnu H1, da su stari proizvodi bolj i od novog.

    POSTUPAK TESTIRANJA HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    108/166

    Postupak testiranja hipoteza o vrednosti nekog parametra

    osnovnog skupa sprovodi se prema precizno definisanojproceduri. Koraci u tom postupku su:

    1. formulacija statistike hipoteze;2. izbor statistike testa i odreivanje njenog oblika

    distribucije;

    3. odreivanje nivoa znaajnosti testa;4. definisanje pravila na osnovu kog se odluuje o

    prihvaanju ili odbacivanju hipoteze;5. izbor sluajnog uzorka odreene veliine i izraunavanje

    statistike testa;

    6. donoenje odluke o prihvaanju ili odbacivanjuhipoteze.

    POSTUPAK TESTIRANJA HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    109/166

    Nulta i alternativna hipoteza predstavljaju dve precizne,

    meusobno iskljuive tvrdnje o vrednosti nekog parametraosnovnog skupa.

    dvosmerni test

    jednosmerni, test na gornju granicu

    jednosmerni, test na donju granicu

    00 : H 01 : H

    00 : H 01 : H

    00 : H 01 : H

    POSTUPAK TESTIRANJA HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    110/166

    Statistika testa ili test-statistika je kriterijum na osnovu kog sesprovodi testiranje.

    Kod testiranja pretpostavki o vrednosti parametara osnovnogskupa, statistika testa je nepristrasna procena parametra ili neka

    transformacija te procene. Statistika testa je sluajna varijabla koja poprima odreeni oblik

    distribucije verovatnoe.

    Za primer varijable aritmetike sredine uzorka vai pravilo onormalnom obliku distribucije ~ N*,

    2

    0 , x

    * Centralna granina teorema

    TESTIRANJE HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    111/166

    TESTIRANJE HIPOTEZA

    Njena standardizovana vrednost

    za velike uzorke ima oblik jedinine normalne distribucije Z ~ N(0,1), aza male uzorke standardizovana varijabla

    ima oblik T-distribucije za (n-1) stepeni slobode.

    x

    XZ

    0

    x

    XT

    0

    TESTIRANJE HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    112/166

    (1 - )

    /2/2

    Z ~ N(0,1)

    -z 0 +z

    Podruje odbacivanja Podruje prihvaanja Podruje odbacivanja

    Dvosmerni test

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    113/166

    TESTIRANJE HIPOTEZA

    -z 0

    Podru e odbacivan a Podru e rihvaan a

    1 -

    Z ~ N(0 , 1)

    0 z

    Podruje prihvaanja Podruje odbacivanja

    1 -

    Z ~ N(0 , 1)

    Jednosmerni test na donju granicu Jednosmerni test na gornju granicu

    TESTIRANJE HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    114/166

    TESTIRANJE HIPOTEZA

    Sledei korak kod testiranja hipoteze je izbor sluajnoguzorka odgovarajue veliine.

    Za uzorakse vre potrebni obrauni i izraunavavrednost statistike testa.

    Koristei uzorak, izraunava se standardna greka, brojstepeni slobode, test statistika, i P-vrednost povezana satest statistikom.

    Donoenje odluke :

    Ako je statistika testa iz podruja prihvaanja nultehipoteze, nulta hipoteza se prihvata kao mogua, aalternativna hipoteza se odbacuje.

    U protivnom, kada je vrednost statistike testa iz podrujaodbacivanja hipoteze, prihvatie se alternativna hipoteza.

    P-VREDNOST

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    115/166

    V NOS

    Pretpostavimo da sprovedemo eksperiment u kojem su izmerene

    srednje vrednosti u dva uzorka koje su razliite. Kako se moe bitisiguran o pretpostavljenoj srednjoj vrednosti populacije?

    Postoje dve mogunosti:

    Populacija ima razliitu srednju vrednost. Populacije ima isti srednju vrijednost, a dobijena razlika je poslediva

    sluajnog uzorkovanja. P vrednost je verovatnoau rasponu od nula do 1

    U praksi se dobijena P-vrednost iz uzorka poredi sa stvarnimnivoom znaajnostinaegtesta (0,05, 0,01) i, ako je manja,dobijena razlika je znaajna. (ako je naa p-vrednost "p

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    116/166

    SREDINI OSNOVNOG SKUPA

    Testiranje hipoteze o pretpostavljenoj vrednosti aritmetike sredineosnovnog skupa sprovodi se na osnovu sluajnog uzorka veliine njedinica.

    Statistika testa je aritmetika sredina uzoraka koja predstavlja sluajnuvarijablu.

    Varijabla aritmetikih sredina uzoraka, odnosno njenastandardizovana vrednost, moe imati oblik normalne distribucije iliT-distribucije.

    U zavisnosti od oblika distribucije, testiranje hipoteza o aritmetikojsredini osnovnog skupa sprovodi se pomou z-testaili t-testa.

    Postupak testiranja hipoteze poinjepostavljanjem nulte i alternativne

    hipoteze.

    TESTIRANJE HIPOTEZA O ARITMETIKOJ

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    117/166

    SREDINI OSNOVNOG SKUPA

    Postavka hipoteze za dvosmerni test

    Postavka hipoteze za jednosmerni test na gornju granicu

    Postavka hipoteze za jednosmerni test na donju granicu

    00 : H 01 : H

    00 : H 01 : H

    00 : H 01 : H

    TESTIRANJE HIPOTEZA O ARITMETIKOJ

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    118/166

    SREDINI OSNOVNOG SKUPA

    Test stati sti ka je varijabla aritmetikih sredina uzoraka koja imanormalnu distribuciju~ (,), ili standardizovana varijablasredina uzoraka,

    koja imajedinini normalni oblik distribucije,

    Z ~ N(0.1).

    Pravilo odluivanjao prihvaanju ili odbacivanju nulte hipoteze sepostavlja u zavisnosti od oblika hipoteze i nivoa znaajnosti testa .

    TESTIRANJE HIPOTEZA O ARITMETIKOJSREDINI OSNOVNOG SKUPA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    119/166

    SREDINI OSNOVNOG SKUPA

    Pravila odluivanja kada je podruje prihvaanja nulte hipoteze datou mernim jedinicama obeleja su:

    Kod dvostranog testa nulta hipoteza se prihvata, na nivou znaajnosti, ako je aritmetika sredina uzorka iz intervala (c1,c2), gde je

    Kod jednostranog testa na gornju granicu nulta hipoteza se prihvaa kadaje aritmetika sredina uzorka iz intervala (-,c2), gde je

    Kod jednostranog testa na donju granicu nulta hipoteza se prihvaa kadaje aritmetika sredina uzorka iz intervala (c1, +,), gde je

    xSzc 2/101 xSzc 2/102

    xSzc 102

    xSzc 101

    PRAVILA ODLUIVANJA O TESTIRANJU HIPOTEZA OARITMETIKOJ SREDINI OSNOVNOG SKUPA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    120/166

    ARITMETIKOJ SREDINI OSNOVNOG SKUPA

    Pravila odluivanja o prihvaanju ili odbacivanju nulte hipoteze kadaje podruje prihvaanja dato u standardizovanim jedinicama su:

    Kod dvostranog testa nulta hipoteza se prihvaa, na nivouznaajnosti , kada je empirijska z-vrednost po apsolutnojvrednosti manja od tabline zvrednosti za vrednost funkcije

    distribucije

    Nulta hipoteza kod jednostranih testova na gornju granicu seprihvaa kada je

    Nulta hipoteza kod jednostranih testova na donju granicu seprihvaa kada je

    2/1 zz

    1zz

    1zz

    POSTUPAK TESTIRANJA HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    121/166

    Sa unapred zadatom verovatnoom( na primer 0,95) se moe odrediti kritini

    interval, npr. (-k, +k) i proveriti da li izraunata vrednost pripada tomintervalu.

    U sluaju da pripada se zakljuuje da odstupanja imaju sluajankarakter inema razloga za odbacivanjem nulte hipoteze

    Za verovatnou od 0,95, prag znaajnosti je0,05 , a to znai da postoji 5%rizikada se napravi greka tj. daposmatrana vrednosti ne pripadaizraunatom intervalu i da nulta hipotezanije tana.(To znaida su ostupanjaod poetnehipoteze znaajna.)

    BITNO:

    Treba odrediti kritinuvrednost k.

    (Kako odrediti k? Gde povuigranicu izmeusluajnihi znaajnihodstupanja??)

    TESTIRANJE CENTRALNE TENDENCIJE-

    DVOSTRANI TEST

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    122/166

    DVOSTRANI TEST

    Ukoliko je dobijamo oblast prihvatanja nulte hipoteze, interval ,k k

    0H

    2

    kk

    o

    kriticna oblast

    oblast odbacivanja H

    kriticna

    oblast

    1 2

    tan ooblast prihva ja H

    0 0 1 0: :H H

    P X k

    TESTIRANJE CENTRALNE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    123/166

    TENDENCIJE- JEDNOSTRANI TEST

    Jednostrani i test:

    ko

    kriticna oblast

    oblast odbacivanja H

    1

    tan ooblast prihva ja H

    k

    o

    kriticna oblast

    oblast odbacivanja H

    1

    tan ooblast prihva ja H

    P X k

    P X k

    GREKE TESTIRANJA HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    124/166

    Greke prvog tipa, grekenastaju kada nultu hipotezuodbacimo, a tana je i prihvatimo alternativnu hipotezu.

    Greke drugog tipa, greke nastaje kada nultu hipotezu neobacimo, a pogrena je.

    GREKE TESTIRANJA HIPOTEZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    125/166

    Odluka

    Odbaciti H0 Ne odbaciti H0

    Istina

    H0

    GrekaI vrste, testiranjem

    H0 se odbacuje uz

    verovatnou

    Prava odluka, testiranjem

    H0 se prihvata uz

    verovatnou (1)

    H1

    Dobra odluka, testiranjem

    H0 se odbacuje uz

    verovatnou (1)

    (ova verovatnoa se zove''jaina testa'' ili ''motesta'')

    GrekaII vrste, ,

    testiranjem H0 se prihvata

    TESTIRANJE HIPOTEZE H0(=0)ako je poznato

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    126/166

    ako jepoznato U sluaju testiranja nulte hipoteze H0protiv alternativne

    hipoteze H1, ako sluajna promenljiva ima normalnuraspodelu, a disperzija je poznata, vai

    Ako sluajna promenljiva nema normalnu raspodelu,uvodimo statistiku

    koja ima normalnu standardnu, N(0,1) raspodelu, gde je

    - aritmetika sredina dobijena na osnovu uzorka,0- predpostavnjena vrednost sredine populacije, - standardno odstupanje populacije inje obim uzorka.

    0XZ

    n

    P X z

    TESTIRANJE HIPOTEZA: SREDNJE VREDNOSTI

    Testovi mogu bitidvosmernikada testiramo hipotezu da jed j d j d k k j lj j d i

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    127/166

    srednja vrednost jednaka nekoj pretpostavljenoj vrednosti,H0(= nasuprot hipoteze H1(

    Kritina oblastprihvatanja nulte hipoteze je na osnovu zadatogpraga znaajnosti:

    Oblast prihvatanja

    [-z, z]

    a oblast odbacivanja ,

    , ,z z

    0 0 0k X k

    P

    n n n

    P z Z z

    PRAG ZNAAJNOSTI-DVOSTRANI TEST

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    128/166

    Za verovatnou , prag znaajnosti, se obino uzimajuvrednosti 0,01 i 0,05, a za izraunavanje se koristetablice normalne raspodele.

    0H2

    z 0kriticna oblast za H

    oblast odbacivanja

    kriticna

    oblast

    1 2

    z

    PRAG ZNAAJNOSTI-JEDNOSTRANI TEST

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    129/166

    JEDNOSTRANI TEST

    z 0kriticna oblast za H

    1

    0

    tan

    XZ

    n

    oblast neprihva jaP Z z

    z

    0kriticna oblast za H

    0

    tan

    XZ

    n

    oblast neprihva jaP Z z

    taoblast neprihva anja

    P Z z

    PRIMER:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    130/166

    Za doziranje nekog leka se zna se da ima

    normalnu raspodelu N(,9). Uzet je uzorakod n= 10 pacijenata i na osnovu dobijenih

    podataka dobijena je srednja vrednost dozeod 24,3gr.

    Sa pragom znaajnosti od 5% testiratihipotezu za matematiko oekivanje doze od24gr nasuprot altetnativnog matematikogoekivanja doze od 26gr.

    PRIMER-REENJE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    131/166

    0 1

    : ,9 , 24,3

    3; 10; 0,05

    24 ; 26

    X N X

    n

    H H

    0H 0,05

    1,64z 0kriticna oblast za H

    0,95

    3,16

    N(, 2

    ):

    Oblast prihvatanja:

    < 1

    z=z0.95=1,64

    24,324310 0,316

    0,316

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    132/166

    Iz populacije sa obelejem X za koje se zna da je odstupanje 300, ne zna se

    raspodela, uzet je uzorak oblika 99856 i na osnovu njega je dobijena srednjavrednost 24,3. Sa nivoom znaajnosti od 5% testirati hipotezu

    H0(=24

    prema alternativnim hipotezama

    1. H1(>24

    2. H1(

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    133/166

    0 1

    : ,300 , 24,3

    9; 99856; 0,05

    24 ; 24

    X N X

    n

    H H

    0H 0,05

    1,64z 0kriticna oblast za H

    0,95

    24,3X

    0 24H 1 24H

    0

    Oblast prihvatanja:

    < 1 z=z0.95=1,64

    Kritina vrednost k:2430099856

    z0.95 1,6425 ,26

    Zakljuak: Ne odbacujemo H0

    0 24H 1 24H Reenje za 1- preko kritine vrednosti, Z:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    134/166

    0 1

    : ,300 , 24,3

    9; 99856; 0,05

    24 ; 24

    X N X

    n

    H H

    0

    0,95

    24,3 241,56300

    99856

    1,64

    1,56 1,64

    X

    n

    z z

    0H 0,05

    1,64z 0kriticna oblast za H

    0,95

    1,56Z

    0 1

    Zakljuak: Ne odbacujemo H0

    0 24H 1 24H Reenje za 2:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    135/166

    0 1

    : ,300 , 24,3

    9; 99856; 0,05

    24 ; 24

    X N X

    n

    H H

    0

    0,05

    24,3 24 1,56300

    99856

    1,64

    1,64 1,56

    X

    n

    z z

    0

    0H0,05

    1,64z

    0kriticna oblast za H

    0,95

    1,56Z

    Zakljuak: Ne odbacujemo H0

    0 24H 1 24H

    Reenje za 3:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    136/166

    hipotezu Ho ne odbacujemo.

    0 1

    : ,300 , 24,3

    9; 99856; 0,05

    24 ; 24

    X N X

    n

    H H

    0

    0,95

    ta

    0,95

    1,96

    24,5 240,52 1,96;1,96

    300

    99856

    XZ

    n

    oblast prihva anja

    P Z z

    z z

    0 1

    0H2

    z 0kriticna oblast za H

    oblast odbacivanja

    kriticna

    oblast

    1 2

    z

    TESTIRANJE HIPOTEZE H0(= 0)AKO SLUAJNA PROMENLJIVAIMA NORMALNU RASPODELU, A DISPERZIJA JE NEPOZNATA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    137/166

    Postupak je sliansluajukod normalne raspodele, samo se sada korististatistika

    gde je S standardno odstupanje uzorka, a sluajna promenljiva X imastudentovu t(n-1) raspodelu.

    Dvostrana kritina oblast za nultu hipotezu bila bi , a dobija sena osnovu veze

    gde se t izraunava iz tablica za studentovu raspodelu.

    0X

    Ts

    n

    T t

    P T t

    PRIMER:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    138/166

    Maina proizvodi kuglice prenika debljine 0,5cm.Da bi proverili da likuglice imaju prenik propisane debljine uzima se uzorak od 10 kuglica.Ako je aritmetika sredina uzorka 0,53cm i uzorako standardnoodstupanje 0,03cm, testirati hipotezu da maina proizvodi kuglicepropisanog prenika sa pragom znaajnosti 0,05.

    Reenje:

    H0: =0,5

    H1: 0,5

    0,95

    0 1 1

    : 1 9 2,26

    0,03, 10, 0,53

    0,5 ; 0,53 0,5

    X t n t

    s n X

    H H H

    0/

    < /2 ili0/

    > /2

    REENJEpreko

    odredjivanja kritine oblasti:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    139/166

    odredjivanja kritine oblasti:

    Zakljuak:

    Kako je 0,53 >0,52 odbacujemo nultu hipotezu.

    k=0,52,

    prihvatljiv interval je

    (-0,52

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    140/166

    odredjivanja t- vrednosti:

    Oblast prihvatanja hipoteze Ho

    Nultu hipotezu odbacujemo.

    0

    0,95

    0,51 1

    0,03

    10

    0,50, 95, 9 2, 26

    0,03

    10

    2, 26; 2, 26

    0, 53 0, 5 3,16 2, 26; 2, 260,03

    10

    X kP k T k P

    s

    n

    kP T t

    REENJEpreko

    odredjivanja t vrednosti:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    141/166

    odredjivanja t -vrednosti:

    hipotezu odbacujemo.

    0

    0,95

    0

    0,51

    0,03

    109 1, 833

    1,833

    3,16

    X kP T k P

    s

    n

    t

    t

    X

    s

    n

    0 10,5 ; 0,5H H

    PRIMER

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    142/166

    PRIMER

    Prosean broj greaka u radu jedne maine je 8. Posle intervencije na maini mogueje da doe do poveanja broja greaka.

    Zadatak: Utvrditi da li je dolo do poveanja broja greaka.

    REENJE:

    Da bi se to utvrdilo izvreno je 100 merenja i dobijeni su sledei rezultati:

    Broj

    greaka0-10 10-20 20-30 30-40 >40

    Brojmerenja

    60 20 10 5 5

    REENJE:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    143/166

    Na osnovu zadate tablice izrauna se

    Hipoteza Ho se odbacuje

    2

    1

    0.99

    12,5 128,7 11,35

    100; 0,01;

    8 899 2,36

    12,5 83,94 2,36

    11,35

    100

    o

    X s s

    t raspodela

    n

    H Ht

    T

    Izraunavanje t-vrednosti za 99stepeni slobode za =9,01 za

    jednostranu gornju granicu:

    t-vrednost (desni deo)= 2,36

    PRIMER:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    144/166

    U uzorku od 3000 bacanja noviadobijeno je 1578 grbova. Verovatnoadobijanjagrba je 0,5 i taj podatak uzimamo kao nultu hipotezu, a podatak da ese dobiti viegrbova uzima se kao alternativna hipoteza. Testirati nultu hipotezu sa pragom

    znaajnostiod 0,01.

    Sluajnapromenljiva X predstavlja broj dobijenih grbova, sa binomnom raspodelom,koja se aproksimira normalnom raspodelm.

    Iz uslova zadatka dobijamo da je

    0 10,5 , 0,5H p H p

    0,5; 3000; 1500; 750; 0,01p n np npq

    REENJE:

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    145/166

    Potrebno je odrediti kritinu vrednostk za nultu hipotezu, i ona u ovomprimeru treba da bude vea od 1500, to odgovara verovatnoi od 0,5grbova. Tada ako je broj izraunatih grbova vei od k,odbacujemo hipotezu,inae je prihvatamo.

    Ako bi koristili jednostrani test u naem primeru kritina oblast bila bi

    Kako je dobijena vrednost 1578>1564, izraunatavrednost pripada kritinojoblasti i odbacujemo nultu hipotezu .

    1 0,01 0,99

    1500 15000,99 0,99

    750 750

    15002,32 1564

    750

    P X k P X k P X k

    X X k kP

    npq

    kk

    0

    H

    1500

    I

    1564k 1578

    99% 1%

    REENJE (II NAIN):

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    146/166

    REENJE (II NAIN):

    Ovaj primer mogao se reitii na drugi nain, samo izraunavanjempragaznaajnosti. Takva izraunavanjaimaju odreeneprednosti jer sekvantitativno moeodrediti koliko nulta hipoteza protivreihipotezi .

    Sada u izraunavanjuemokoristiti dvostrani test i za razliku odpredhodnog izraunavanjaodrediti oblast prihvatanja nulte hipoteze.

    T=(1564-1500)/sqrt(750)=2,84, t-vrednost za dvostrani test sa pragom

    znaajnosti 0,01= 2,62.

    2,84>2,62 to znai da odbacujemo nultu hipotezu.

    0H

    1500

    I

    1564k 1578

    99% 1%

    REGRESIONAANALIZA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    147/166

    REGRESIONA ANALIZA

    Regresiona analiza se koristi da proceni vezu

    UVOD

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    148/166

    148

    Regresiona analiza se koristi da proceni vezu

    izmeu nezavisne i zavisnevarijable (promenljive).

    Nakon analize, regresiona statistika moe da sekoristi da predvidi zavisnu variablu kada je

    nezavisna variabla poznata.

    Regresija prevazilazi korelacionu analizu

    dodavanjem predikcije.

    Ljudi koriste regresiju na intuitivnom nivou svaki dan:

    REGRESIJA NA INTUITIVNOM NIVOU

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    149/166

    149

    j g j

    U poslu,dobro obuen ovek se smatra finansijskiuspenijim.

    Majka zna da vie eera u hrani njenog deteta rezultiraveim nivoom energije.

    Lakoa buenja ujutru zavisi od toga koliko kasno smosino legli da spavamo.

    Kvantitativna regresija dodaje preciznost razvojem

    matematikeformule koja moe biti koritena za

    predvianje.

    Istraiva u medicini moe koristiti teinu

    PRIMER

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    150/166

    150

    Istraiva u medicini moe koristiti teinu(nezavisna promenljiva) da predvidi najbolju dozu

    za nov lek (zavisna promenljiva).

    Korisnost regresione analize je odreivanje formulekoja najbolje odraava vezu izmeu dve

    promenljive.

    Onda se moe koristiti tako dobijenaformula da sepredvide vrednosti zavisne promenljive kada je

    jedino nezavisna promenljiva poznata.

    Doktor moeprepisati odgovarajuudozu baziranuna teini pacijenta.

    Regresiona linija (poznata kao linija najmanjih kvadrata) je

    REGRESIONA LINIJA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    151/166

    151

    g j (p j j j ) j

    crte oekivane vrednosti zavisne variable za sve vrednosti

    nezavisne variable.

    Tehniki, to je linija koja "minimizira kvadratna odstupanja".Regresiona linija je ona koja najbolje uklapa (fituje) podatke

    na scaterplotu.

    LINEARNA REGRESIJA- MODEL

    VEZE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    152/166

    152

    Linearna regresija pokuava da modelira vezu izmeu dvevariableprovlaenjemlinearne jednaine kroz posmatranepodatke. Jednavariabla se smatra nezavisnom, a druga zavisnom.

    Na primer, modelar moe eleti da uspostavi vezu teina i visina uenika

    koristei linearni regresioni model. Pre pokuaja da provuelinearnufunkciju (model) kroz posmatrane podatke prvo mora utvrditi da li

    uopte postoji uzajamna povezanost posmatranih variabli.

    VEZE

    VEZA IZMEU DVE VARIABLE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    153/166

    153

    Scatterplot moe biti od koristi u odreivanju jaine veze izmeu dvevariable.

    Ako se pokae da nema povezanosti izmeu nezavisne i zavisnepromenljive (t.j., scatterplot ne pokazuje ni rastui ni opadajui trend),onda primena linearnog regresionog modela nee biti mogua.

    VEZA IZMEU DVE VARIABLE-PRIMER

    Scatterplot

    http://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htmhttp://www.stat.yale.edu/Courses/1997-98/101/scatter.htm
  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    154/166

    Visina Teina

    175 70

    190 87

    189 95

    179 80

    172 69

    186 84

    168 65

    177 75

    180 80

    Koristei regresionu jednainu, zavisna variabla moebiti predviena prekoi i bl

    LINEARNA REGRESIJA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    155/166

    155

    nezavisne variable.

    Nagib regresione linije (b) je definisan kao porast zavisne promenjivepodeljen sa porastom nezavisne promenljive x.

    (a)je taka gde regresiona linija see y osu.

    Nagib u odnosu na x osu i presek sa y osom su inkorporirani u regresionu

    jednainu.

    Presek sa y osom se obino naziva konstanta, a nagib koeficijent. Potoregresioni model obino nijeperfektan prediktor, moramo odrediti i izraz zagreku jednaine.

    Regresiona analiza neke populacije je korisna za teorijska razmatranja, ali u praksipostoji model za procenu koji se dobija iz raspoloivih podataka. Pretpostavimo da

    REGRESIONA JEDNAINA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    156/166

    156

    p j p j j p p pimamo n parova pomatranja (x1, y1) (x2, y2), ... (xn, yn). elimo odrediti pravuliniju

    +koja e se najbolje uklopiti u date vrednosti.Da bismo to uradili moramo odrediti koeficijente a i b tako da suma kvadrata razlikastvarnih i procenjenih vrednosti bude minomalna:

    ( )

    U regresionojjednaini, y je uvek zavisna variabla i x je uvek nezavisna variable. Data sutri ekvivalentna naina da se matematikiopielinearni regresioni model.

    y = intercept + (slope * x) + error

    y = constant + (coefficient *x) + error

    y = a + bx + e

    Regresionajednaina je y = a + bx +

    REGRESIONA JEDNAINA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    157/166

    157

    g j j y

    Postoji nekoliko naina da se izrauna nagib b:

    ()() () (,)

    ili praktino

    Intercept where

    x i y su variable.b = nagib regresione linijea = presek regresione linije i y ose.

    N,N = broj elemenata

    = ()()

    (

    ()

    )

    xbya

    xNx

    yxNxyb

    xbay

    22

    ODSTUPANJA

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    158/166

    158

    SST-totalna suma kvadrata odstupanja y od srednje vrednosti y

    SSR

    -Suma kvadrata odstupanja srednje vrednosti za y i regresionevrednosti za y

    SSESuma kvadrata greke

    SST=SSR + SSE

    KOEFICIJENT UKLAPANJA REGRESIONELINIJE

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    159/166

    159

    Procentualna varijacija y je rezultat varijacije x.

    Koeficijenat uklapanja je

    Objanjive razlike

    Totalne razlike

    0

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    160/166

    160

    PRIMER 1

    Odrediti linearnu regresiju

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    161/166

    161

    Odrediti linearnu regresiju

    X Y60 3.1

    61 3.6

    62 3.8

    63 4

    65 4.1

    Da bismo odredili regresionu jednainu, moramo nai nagib, intercept i uvrstiti ih u regresionu

    jednainu..

    Korak 1: Izraunati broj podataka.

    REENJE=

    (

    )(

    )

    ( ())

    Korak 3:NaiX, Y, XY, X .

    X = 311

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    162/166

    162

    N = 5

    Korak 2: NaiXY, X2Pogledaj tabelu

    b=0,19

    a=-8,098

    Y=-8,098+0,19X

    X Value Y Value X*X X*Y

    60 3,1 3600 186

    61 3,6 3721 219,662 3,8 3844 235,6

    63 4 3969 252

    65 4,1 4225 266,5

    311 18,6 19359 1159,7

    Intercept(a) = (Y -b(X)) / N

    X = 311

    Y = 18.6

    XY = 1159.7X

    2= 19359

    Korak 4: Zameniti vrednosti u datu formulu za nagib.

    Nagib(b) = (NXY - (X)(Y)) / (NX2- (X)2)

    = ((5)*(1159.7)-(311)*(18.6))/((5)*(19359)-(311)2)

    = (5798.5 - 5784.6)/(96795 - 96721)

    = 13.9/74

    = 0.19

    Korak5: Sada zameniti vrednosti u formulu zaintercept a.

    Intercept(a) = (Y -b(X)) / N= (18.6 - 0.19(311))/5

    = (18.6 - 59.09)/5

    = -40.49/5= -8.098

    Korak 6: Na kraju zameniti dobijene vrednosti u formulu regresione linije:

    Regression Equation (y) = a + bx = -8.098 + 0.19x.

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    163/166

    163

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    164/166

    164

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    165/166

    165

  • 7/23/2019 Uvod Statisticke Metode Istrazivanja

    166/166

    HVALA NA PANJI!