Dod. Predavanjima 9- 12 iz VIS-a (2012 -2013)- Uvod u op¹tu i matematièku statistiku (dio materijala za 3. ciklus-Doktorski studij)

Embed Size (px)

DESCRIPTION

hjgcutgcugcuzczuc86

Citation preview

  • 1

    GFS - T E O R I J A V J E R O V A T N O E I S T A T I S T I K A

    Onaj koji cijeni praksu bez teorijskih

    osnova slian je moreplovcu koji ulazi u brod bez krme i busole ne znajui

    kuda se plovi. ( LEONARDO DA VINCI )

    P r e d a v a n j a na Poslijediplomskom doktorskom studiju graevinarstva

    u akademskoj 2009/2010. godini

    D R U G I D I O

    O P T A I M A T E M A T I K A S T A T I S T I K A

    1. U V O D

    1.1. Poeci, razvoj, znaaj i definicija statistike

    Pri izuavanju Teorije vjerovatnoe upoznali smo se sa nekim pojmovima koje prouava ili na kojima se zasniva statistika. Oslanjajui se na ve izneeni razvijeni aparat teorije vjerovatnoe (TVJ), koja, inae, predstavlja matematiku strukturu na kojoj su zasnovane statistike metode, u ovom poglavlju date su osnove statistike u mjeri koja je neophodna za primjenu statistike u tehnikim naukama, posebno u saobraaju, komunikacijama i informatici, ali i koja je neophodna za logiki tok daljeg dubljeg izuavanja i odgovarajuih primjena. Rije statistika potie od latinske rijei status to znai stanje, drava, ... . Kao nauka pojavljuje se u XVII vijeku, mada neki korijeni statistikih metoda potiu jo iz vremena najstarijih civilizacija. Smatra se da je rije statistika prvi upotrijebio naunik Gotfrid Ahenval (Gottfried Achenwall, 1719-1772), unosei ovaj naziv u svoje radove i u naziv jednog predmeta (pod nazivom Notitia politica vulgo statistica) na njemakom univerzitetu u Getingenu. Dok je u Njemakoj i ostalim razvijenim zemljama kontinentalne Evrope razvoj statistike djelatnosti bio pod snanim uticajem osnivaa univerzitetske kole-dravopisa, dotle se u Engleskoj razvio drugi pravac, tzv. Politika aritmetika koja svoje teorijske osnove ima u racionalnoj filozofiji Leonarda da Vinija, Dekarta i dr. Osniva ove kole bio je Don Graunt (John Graunt, 1602-1674), dok je osniva pravca univerzitetska statistika bio prof. Hermann Conring (1606-1671) / profesor istraivaa Gotfrida /. U XIX vijeku statistika se znatno razvila po sadrini i metodama, naroito koritenjem rauna vjerovatnoe. Prve takve radove nalazimo kod Laplasa (Pierre Simon de Laplace) i (Jean Baptiste Joseph) Fouriera poetkom XIX vijeka, kada su u Parizu i departmanima Sene vrili procjenu broja ukupnog stanovnitva na bazi uzorka sa izraunavanjem najvjerovatnije greke.

    Meutim, najznaajnije ime u razvoju statistike XIX vijeka je belgijski fiziar i astronom (Lambert Adolphe Jacob) Ketle (Quetelet, 1796-1874), na iju je inicijativu odran

  • 2

    i kongres statistiara u Briselu (Brussels, Belgique-Belgium) 1853. godine, a zatim jo est kongresa u zemljama srednje Evrope. Kao to je XX vijek postao vijek tehnike i hemije, a isto tako je to i vijek statistike koja proima sav na ivot, jer se danas statistike metode koriste u raznim istraivanjima (u fizici, tehnici, socioloko-politikim istraivanjima, ekonomiji itd.). Od kraja XIX vijeka na ovamo statistika se naglo razvija i kao nauka i kao djelatnost-praksa. Poetkom ovog vijeka javljaju se razliite metrije (biometrija, ekonometrija, sociometrija, ...), a sredinom ovog vijeka javljaju se i neke bliske discipline kao to su: kibernetika, teorija informacija, teorija veza i sl. Javlja se kao posebna disciplina i matematika statistika, koja je oznaila upotpunjavanje i dalje razvijanje teorije i metodologije kvantitativnog istraivanja masovnih pojava. U mnogim knjigama nalaze se razni pokuaji definiranja statistike. Tako npr., Silvio Elazar (u knjizi: Matematika statistika) daje ovu definiciju: Matematika statistika je nauka koja se bavi prouavanjem zakona sluajnih dogaaja na osnovu teorije vjerovatnoe, matematikom obradom podataka mjerenja masovnih pojava., dok neki drugi autori daju i ovu definiciju: Nauka koja prouava pojave koje obuhvataju vrlo veliki broj elemenata koji imaju neko zajedniko svojstvo (obiljeje) naziva se matematika statistika. Matematika statistika javlja se u XVIII vijeku, prvenstveno u radovima D. Bernoullija i fiziara Maxwella. No, savremena uenja u XX vijeku mogla bi se izrei po pitanju definiranja statistike kao naune discipline u smislu da se usvoji ova (opisna) definicija: Statistika je nauka o varijacijama obiljeja, zakonitostima razvoja i odnosa masovnih pojava i njihovih elemenata u vremenu i prostoru. (U vezi sa gore navedenim definicijama i u vezi sa osnovnim pojmovima opte i ekonomske statistike moe se nai u knjizi: Dr. Milo Blai, Opta statistika, Savremena administracija, Beograd, 1982.) Statistike metode istraivanja primjenjuju se na gotovo sva podruja ljudske djelatnosti, gdje god se javlja veliki broj posmatranja, eksperimentisanja i mjerenja (kao npr., pri izuavanju problema dohotka-profita, nataliteta, mortaliteta, te raznih mjerenja u fizici, hemiji, tehnici, ...). U statistici se prvo prikupe podaci o pojavama koje se istrauju pomou opaanja, anketa, popisa i dr., pa se ti podaci obrauju i izvode odreeni zakljuci i prognoze.

    1.2. Predmet i zadaci statistike. Osnovni skup i obiljeje

    U okviru statistike kao discipline razvijaju se i primjenjuju metode izuavanja (dobivanja, opisivanja i obrade) statistikih podataka s ciljem ustanovljavanja zakonitosti koje vae u odreenim sluajnim masovnim pojavama i procesima masovnog karaktera. Pri tome se razlikuju sljedea dva osnovna problema:

    1) Razvoj metoda prikupljanja i grupisanja statistikih podataka koji se istrauju (dobijenih ili pomou zapaanja odnosno na osnovu posmatranja ili kao rezultat specijalno izvedenih pokusa kao to su ankete, popisi, mjerenja i sl.).

    2) Razrada i razvoj metoda analize statistikih podataka u zavisnosti od cilja istraivanja.

    U okviru problema pod 2) mogu se identifikovati dvije grupe metoda: a) Metode za ocjenu funkcije distribucije i parametara distribucije (raspodjele,

    razdiobe). Npr., na osnovu odreenih statistikih podataka moe se ocijeniti da oni pripadaju normalnoj (ili binomnoj) raspodjeli, a zatim se mogu odrediti i parametri (oekivanje) i (standardna devijacija) te distribucije.

    b) Metode za provjeru (testiranje) tzv. statistikih hipoteza o obliku (vrsti) zakona distribucije ili ako je oblik zakona distribucije poznat, o parametrima zakona distribucije. Npr., moe se provjeriti da je pretpostavka o normalnoj distribuciji ispravna ili pogrena.

  • 3

    Osnovni predmet razmatranja u statistici su skupovi elemenata koji imaju izvjesne zajednike karakteristike. Pri tome se, intuitivno, pojam osnovnog skupa najee uvodi na jedan od sljedeih (priblino) ekvivalentnih naina:

    (i) Osnovni skup (populacija, generalni skup, statistiki skup, statistika masa) je skup (cjelina) svih istorodnih elemenata (objekata) koji podlijeu (statistikom) ispitivanju.

    (ii) Skup elemenata sa nekom zajednikom osobinom ija mjera vrijednosti varira od elementa do elementa zove se statistiki (ili osnovni skup i sl.).

    (iii) Statistiki skup predstavlja cjelinu sastavljenu od istorodnih meusobno uporedivih elemenata sa zajednikim varijabilnim obiljejem to je u stvari tekua varijabla (npr. ix ) sluajne promjenljive (npr. X ).

    (iv) Skupovi elemenata koje prouava statistika zovu se osnovni skupovi (ili populacije i sl.).

    U definicijama (i), (ii) i (iv) definira se jo i pojam obiljeja, tj. kae se jo da se zajedniko svojstvo elemenata odreenog osnovnog skupa zove obiljeje tog skupa. Obiljeje moe biti numerikog ali i atributivnog karaktera. No, obiljeja atributivnog karaktera mogu se svesti na obiljeja numerikog karaktera.

    Iz prethodnih definicija slijedi da osnovni skup mora biti homogen, tj., sastavljen od istovrsnih i meusobno uporedivih elemenata u odnosu na tekuu varijablu ( )ix sluajne veliine ( )X zajednikog obiljeja, te mora biti i varijabilan, tj. elementi osnovnog skupa moraju biti istovrsni ali ne i istovjetni u odnosu na zajedniko svojstvo (obiljeje) koje karakterie skup istovrsnih objekata. Ako je na osnovnom skupu definirano samo jedno obiljeje, skup je jednodimenzionalan. Ako su definirana dva obiljeja, skup je dvodimenzionalan. Zavisno od toga da li je obiljeje skupa kontinualno (neprekidno), diskretno ili mjeovitog tipa, razlikuju se kontinualni, diskretni i mjeovitog tipa statistiki skup.

    Definicija 1.2.1. Obimom osnovnog skupa nazivamo broj njegovih elemenata (objekata) u sluaju da je skup konaan, odnosno obim je kardinalni broj (mo skupa) u sluaju beskonanog skupa.

    Posmatrajmo osnovni skup (obima N ) kod kojeg se vrijednost 1x posmatra ili uzima u razmatranje ( )1 1n f= puta, vrijednost 2 ,x ( )2 2n f= puta, ... , vrijednost ,kx ( )k kn f= puta, pri emu je

    1

    k

    ii

    n N=

    = ( )1 . Posmatrane vrijednosti ix ( )1,i k= nazivaju se varijantama (varijansama), a niz

    varijansi napisan u rastuem poretku zove se varijacioni red osnovnog skupa. Brojevi ( )i in f= zovu se uestanostima (frekvencijama) odnosno apsolutnim frekvencijama, a

    njihov odnos prema obimu osnovnog skupa N se zove relativna frekvencija (relativna uestanost) i oznaava se esto sa i ( )ili ip , tj.

    ( ), 1,ii n i kN = = . ( )2 .

  • 4

    Definicija 1.2.2. Skup (ureenih) parova ( ) ( ) ( ){ }1 1 2 2, , , , , , ,n nx f x f x fL L vrijednosti ix i njihovih frekvencija if obiljeja X , ureen po rastuim vrijednostima

    1, , nx xK obiljeja X , zove se distribucija ili raspodjela (statistika raspodjela) frekvencija obiljeja X osnovnog skupa.

    Dakle, statistika raspodjela frekvencija (odnosno relativnih frekvencija) je

    pridruivanje (preslikavanje) izmeu vrijednosti obiljeja (varijansi) i njihovih frekvencija (odnosno relativnih frekvencija). Takoe se uvodi i pojam statistike raspodjele osnovnog skupa kao zajedniki naziv za statistiku raspodjelu relativnih frekvencija i statistiku raspodjelu apsolutnih frekvencija, tj. statistika raspodjela osnovnog skupa je pridruivanje izmeu vrijednosti obiljeja (varijansi) i njihovih frekvencija ili relativnih frekvencija. Najee se statistika raspodjela prikazuje tabelarno a ponekad i grafiki. Tabela je obino u obliku:

    Pri tome su vrijednosti 1, , kx xK uzete u rastuem poretku a osnovni skup je konaan. Meutim, grafiki se statistika raspodjela prikazuje analogno kao i zakon raspodjele vjerovatnoe u Teoriji vjerovatnoe pomou poligona, histograma i dr. Naime izlomljena linija koja povezuje ureene parove ( ),i ix f (odnosno ( )iix , zove se poligon frekvencija (odnosno, poligon relativnih frekvencija). Obino se pod histogramom frekvencija (relativnih frekvencija) podrazumijeva unija pravougaonika ije osnovice na osi apscisa x imaju mjerni broj duine 1, a takoe su sredita osnovica vrijednosti ix posmatranog obiljeja X , a mjerni brojevi visina su jednaki vrijednosti pojedinih frekvencija (relativnih frekvencija). Pri tome se najee dijagram frekvencija produi do ose apcisa xO , tako da povrina omeena tim dijagramom i osom xO bude jednaka povrini posmatranog histograma.

    Primjer 1.2.1.a). U jednom razredu od 30 uenika uspjeh iz matematike prikazan je sljedeom tabelom:

    Tabela 1

    Ocjena iz matematike x Frekvencija f Relativna frekvencija f / 30

    x1 = 1 1 3f = 1 0,1 = x2 = 2 2 6f = 2 0,2 = x3 = 3 3 10f = 3 0,3 = x4 = 4 4 8f = 4 0,3 = x5 = 5 5 3f = 5 0,1 =

    ta je ovdje osnovni skup? Nacrtati odgovarajui poligon i histogram frekvencija.

    x x1 x2 . . . xk

    f f1 f2 . . . fk

  • 5

    Rjeenje. Skup uenika u razredu je osnovni skup iji je obim N = 30, a njihov uspjeh izraen ocjenom je obiljeje koje se posmatra. U prvoj koloni unijete su vrijednosti koje poprima obiljeje X . U drugoj koloni unijeti su brojevi if (i = 1, 2, ... , 5) uenika koji su postigli ocjenu ix ( if - su apsolutne frekvencije), u treu kolonu upisuju se relativne frekvencije elemenata osnovnog skupa.

    Sl.1.2.1. Primjer 1.2.1.b). Na jednoj stonoj farmi je statistiki posmatrana mlijenost stotinu

    krava, tj. broj X hl mlijeka koje svaka krava daje godinje. Podaci su prvo sreeni, pa su onda napisani u Tabeli 2. Nacrtati odgovarajui dijagram frekvencija i histogram frekvencija, te izvesti odgovarajue prirodne zakljuke.

    Tabela 2

    Klase obiljeja

    x

    Sredina Klase

    Broj krava

    f

    Relativna frekvencija

    f / 100 29 - 31 30 2 0,02 31 - 33 32 10 0,1 33 - 35 34 18 0,18 35 - 37 36 30 0,3 37 - 39 38 22 0,22 39 - 41 40 13 0,13 41 - 43 42 3 0,3 Ukupno 100 1

    Rjeenje. U ovom primjeru je osnovni skup krdo od 100 krava ( )100N = , a obiljeje koje se posmatra je mlijenost tih krava. Poto je broj elemenata populacije veliki (broj krava 100), a ima i puno vrijednosti obiljeja X, ne bi bilo pregledno kada bi se dala raspodjela za svaku vrijednost obiljeja posebno. Zato je segment [ ]43,29 , duine 29 43 = 14 izmeu najvee i najmanje vrijednosti podijeljen na sedam intervala duine 2 ( )14 : 7 2= (napomenimo da se esto u praksi broj klasa uzima tako da on bude priblino jednak n ;

    0 1 2 3 4 5

    3

    6

    8

    10

  • 6

    gdje je n broj elemenata osnovnog skupa (konanog), ali se uz to esto uzima da je tim brojem klasa djeljiva razlika izmeu najvee i najmanje vrijednosti obiljeja X). Aritmetika sredina donje i gornje granice jedne klase zove se sredina te klase. U statistikoj obradi podataka klasu moe reprezentovati njena sredina. Na sljedeoj slici je prikazan dijagram raspodjele tih sredina, tj. dijagram raspodjele klasa kao i histogram frekvencija. Sl. 1.2.2. Sl. 1.2.3.

    Jo o pojmu statistikog skupa i statistike raspodjele

    U statistici se posmatraju problemi sa vrlo mnogo podataka, tj. (vrijednosti obiljeja),

    pa se javlja veliki broj intervala tih vrijednosti. Duine tih intervala su male pa se poligon raspodjele frekvencija pribliava tzv. krivoj (krivulji) frekvencija kao na sl. 1.2.3.

    Vie formalno moemo ovako uvesti pojam osnovnog skupa i obiljeja. Osnovni

    predmet razmatranja u statistici je skup, recimo (neprazan skup) elemenata, recimo , koji se zove osnovni skup ili populacija. Kod svakog elementa posmatra se neka numerika karakteristika, recimo ( )X , koja se zove obiljeje (svojstvo, osobina) X. Dakle, obiljeje X je funkcija (preslikavanje) sa (ili iz ) u skup R (ili u R ili u C ili u jo optiji skup). Za ovu funkciju pretpostavlja se da je F - izmjeriva, tj. da je

    [ ]( ) { }( )1 , :X a b a X b = < F (tj. da je ovaj skup dogaaj) za svaki interval [ a, b ) R, gdje je F - algebra ( - polje) podskupova skupa . Takoer smo mogli zahtijevati da je ( )( )1 ,X x F ( x R ) jer je ( ){ }, :x x R =

    { } { }, : , :x x x x = + = + =R R[ ) [ ) BR, gdje je BR - algebra Borelovih skupova na R (tj. najmanja - algebra podskupova iz R koja sadri familiju svih otvorenih skupva na R). Svaki otvoren skup na R je prebrojiva unija otvorenih intervala

    0 29 31 33 35 37 39 41 43

    3

    10

    18

    30

    x

    (36,30)

    (32,10)

    f

    x

    f

  • 7

    ( ),B a b= ( ),a b a bR 1.

    xF x q

    =

    Primjer 1.2.3. Populaciju ini skup svih mjerenja neke veliine izraene brojem m.

    Kao obiljeje X = X ( ) moemo uzeti upravo rezultat mjerenja . Vjerovatnoa P neka je definirana relacijom { } ( )

    2

    2212

    x mb

    a

    P a X b e dx = , gdje su mR i + R . Tada

    imamo da je obiljeje X sluajna veliina s Gaussovom distribucijom (normalnom)

    N ( )2,m , zadanu funkcijom gustoe: ( ) ( )2

    2212

    x m

    f x e = .

    10.3. Sluajni uzorak

  • 8

    Pod statistikim pokusom ili statistikim eksperimentom podrazumijeva se registriranje vrijednosti obiljeja X kod elemenata iz nekog podskupa osnovnog skupa . Osnovni predmet statistikih zakljuivanja jeste da se na osnovu statistikih pokusa neto zakljui o distribuciji ( )xF x obiljeja X . Pretpostavimo da treba ispitati neko svojstvo (obiljeje) koje karakterie skup istorodnih objekata, tj. neki osnovni skup . Da bi to uradili moe se sprovesti potpuno ispitivanje posmatranog skupa . No, oigledno je da ako je konaan i statistikim pokusom registrujemo obiljeje X svakog elementa , onda je distribucija xF ptpuno odreena. Meutim, redovna je situacija takva da statistiki pokus sproveden nad pravim podskupom od koji se naziva uzorak. Razlozi za to mogu biti slijedei: 1) principijelna nemogunost da se obiljeje X registruje kod svakog elementa ,

    odnosno da pri velikom broju objekata (elemenata) ostvariti potpuno ispitivanje nije mogue;

    2) trokovi ili praktina besmislenost takvog postupka tj. isptivanje vezano za unitavanje objekata ili je vezano za velike materijalne trokove, (npr., ako je osnovni skup mjesena proizvodnja jedne fabrike sijalaica, a obiljeje X recimo vijek trajanja sijalice, registriranje obiljeja na cijeloj populaciji dovodi do unitavanja cijele mjesene proizvodnje).

    Primijetimo da je u primjeru 1.2.1.b) utvrena klasa obiljeja (mlijenosti) za svaku

    pojedinu kravu populacije. Najee populacija ima veoma mnogo elemenata (a esto beskonano), pa je u praksi teko ili ak nemogue za svaki od njih ustanoviti odgovarajuu klasu, odnosno ispitati posmatrano obiljeje svih elemenata te populacije. Ovakvim sluajevima, i openito u sluajevima navedenim pod 1) ili 2), za ispitivanje obiljeja X koje nas interesuje, primjenjuje se metod izbora. Sutina ovog metoda sastoji se u tome to se ispitivanju podvrgnu ne svi objekti (elementi), ve jedan njihov dio sluajno izabranih iz posmatranog osnovnog skupa. Rezultati koji se dobiju pri ispitivanju tog dijela prenose se na sve elemente posmatranog skupa elemenata.

    Definicija 10.3.1. Izabranim skupom ili uzorkom naziva se skup objekata sluajno

    izabranih iz osnovnog skupa. Ponekad se pod pojmom statistiki skup ili statistika masa podrazumjeva bilo osnovni skup bilo uzorak.

    Dakle, iz osnovnog skupa izdvojimo, putem sluajnog odabiranja, jedan pravi podskup

    na kojem vrimo ispitivanja i donosimo zakljuke, koji se zove sluajni uzorak osnovnog skupa. Prouavanjem sluajnog uzorka donosimo zakljuke o samom osnovnom skupu, tj. zakljuke koji e pod izvjesnim uslovima vaiti za itav osnovni skup. Da bi ti zakljuci bili to pouzdaniji, potrebno je da uzorak to bolje predstavlja populaciju, tj. da bude reprezentativan, to je sluaj ako on ima dovoljan broj elemenata i ako su oni odabrani sluajno, a svi elementi osnovnog skupa treba da imaju jednaku vjerovatnou da uu u uzorak. U praksi postoji niz metoda za formiranje sluajnih reprezentativnih uzoraka (na bazi tablice sluajnih brojeva i dr.).

    Analogno, kao to smo i kod osnovnog skupa imali, definiraju se i za uzorak analogni pojmovi kao to su obim, varijansa, statistika raspodjela uzorka (relativnih ili apsolutnih frekvencija), poligon, histogram (varijacioni red, varijacioni interval itd.).

  • 9

    Definicija 1.3.2. Obimom (ili veliinom, duinom) uzorka naziva se broj njegovih elemenata (objekata), jasno ukoliko je ozorak konaan. Ako sa N oznaimo obim osnovnog skupa, a sa n obim uzorka, tada je po pravilu n N

  • 10

    odgovarajuih frekvencija i (ili in onda se na osu apcisa nanosi ix , a na osu ordinata ni (ili i ). Dobijemo take, recimo ( )1 1 1,M x n , ( )2 2 2,M x n , , koje strogo uzevi predstavljaju

    grafik statistike raspodjele u Dekartovom koordinatnom sistemu. Dobijene take povezujemo odrescima pravih. Tako dobijena linija (izlomljena) zove se poligon frekvencija (apsolutnih ili relativnih) uzorka. Ako je statistika raspodjela uzorka zadana preko intervala i odgovarajuih frekvencija, onda se konstruie histogram frekvencija. Naime, interval kome pripadaju sve posmatrane vrijednosti neprekidnog obiljeja X dijeli se na nekoliko podintervala jednake duine h. Na svaki i - ti podinterval unosimo broj ni (suma frekvencija varijanti koje pripadaju i tom podintervalu. Na osu apscisa nanosimo podintervale duine h, a na istim podintervalima

    konstruiemo pravougaonike visine h. Kolinik inh

    zove se gustoa frekvencije. Stepenasta

    figura koja se sastoji iz pomenutih pravougaonika zove se histogram frekvencije uzorka. Povrina S histograma jednaka je sumi svih frekvencija obima uzorka. Naime, ako je Si

    povrina i tog pravougaonika, onda je ii inS h nh

    = = , pa je 1 1

    k k

    i ii i

    S S n n= =

    = = = . Na isti nain konstruie se i histogram relativnih frekvencija uzorka, tj. stepenasta

    figura predstavljena pravougaonicima ija je osnovica duine (podintervala) h, a visina ix

    h= . Odnos ix

    h= zove se gustoa relativnih frekvencija uzorka. Povrina S histograma

    relativnih frekvencija uzorka jednaka je 1. Zaista, kako je 1

    , ,k

    ii i i

    iS S S h

    h

    == = = to je

    1 1 1 1

    1 1k k k k

    ii i i

    i i i i

    nS nn n

    = = = =

    = = = = = .

    Vratimo se ponovo pojmu uzorka. Iz navedenog se vidi da je osnovni problem da uzorak bude reprezentativan, tj. da informacija o distribuciji Fx koju on daje za obiljeje X, bude u izvjesnom smislu tana. Jasno je da se, openito govorei, reprezentativnost uzorka postie ako je nain uzimanja elemenata u uzorak nezavisan od obiljeja koje se posmatra. Meutim, esto je teko provjeriti tu nezavisnost kao to pokazuje sljedei interesantan primjer. Primjer 1.3.2. Dati su podaci jedne ankete socijalnog osiguranja u Poljskoj. Osnovni skup ine svi zaposleni osiguranici iji je broj 2 757131,N = a obiljeje X je vrsta posla i ono uzima slijedee etiri razliite vrijednosti: 1) Radnici, izuzev zaposlenih u ugljenokopima i elianama, 1 1778 446,N = 1 152 812;n = 2) Radnici u ugljenokopima i elianama, 2 250 397,N = 2 22 493;n = 3) Drutvene i javne slube, 3 564147,N = 3 44 040;n = 4) Uslune djelatnosti, 4 164141,N = 4 14 088;n =

    Svega: 2 757131,N = 230 433n = .

  • 11

    Raspodjela vjerovatnoa za obiljeje X je , ( 1, 2, 3, 4)iiNp iN

    = = . Uzorak obima 230 433n = zaposlenih ine svi oni ija prezimena poinju sa P . Raspodjela obiljeja X u tom uzorku

    je inn

    , ( 1, 2, 3, 4)i = . Pokazuje se pomou tzv. Pearsonovog metoda, tj. pomou tzv. 2 - testa, da postoje vrlo znaajne razlike izmeu obiljeja X u osnovnom skupu i u uzorku,

    tako da se uzorak ne moe smatrati reprezentativnim. Napomenimo da je u ovom primjeru bilo teko predvidjeti zavisnost izmeu zaposlenja i poetnog slova prezimena.

    O metodi sluajnog uzorka

    Do sada smo izlagali o uzorku i metodi uzorka intuitivno, a sada emo to initi vie sa formalnog aspekta. Razmatranja u teoriji vjerovatnoe navode nas kako treba uzeti uzorak da bi on bio reprezentativan. Naime, kao to je obrazloeno u prethodnom dijelu teksta, elemente osnovnog skupa treba birati u uzorak sluajno, jer onda oekujemo da se neutraliu sve mogue zavisnosti izmeu posmatranog obiljeja i uzorka. Tako izabran uzorak zove se sluajni uzorak. Nadalje emo se uglavnom baviti uzorkom konstantnog obima n. Kako elemente osnovnog skupa biramo u uzorak sluajno to imamo n sluajnih ishoda 1, , n K naeg statistikog pokusa. Obiljeje X naeg statistikog pokusa posmatrano kod svakog od tih n ishoda daje n - dimenzionalnu sluajnu veliinu ( )1, , nX XK , gdje je ( )k kX X = za

    1, ,k n= K . Kako emo se uglavnom baviti samo jednim obiljejem, npr. X , to imamo n dimenzionalnu sluajnu veliinu ( )1, , nX XK koju emo takoe zvati sluajni uzorak. Otuda vidimo da se sa formalnog aspekta moe rei da je jednodimenzionalni sluajni uzorak obima n ustvari n dimenzionalna sluajna veliina ( )1, , nX XK . Ako pak posmatramo dva obiljeja, recimo X i Y , tj. ako se radi o dvodimenzionalnom statistikom skupu, onda njemu odgovara sluajni uzorak oblika ( ) ( )( )1 1, , ... , , .n nX Y X Y Openito se moe posmatrati k - dimenzionalan statistiki skup, gdje je k prirodan broj. Kada je statistiki pokus jednom sproveden u uzorak je uzeto nekih n elemenata i n dimenzionalna sluajna veliina ( )1, , nX XK postaje n torka brojeva ( )1, , nx xK koja predstavlja tzv. realizovani uzorak. Jednom realizovani uzorak je dakle jedna realizovana vrijednost n - dimenzionalne sluajne veliine.

    Definicija 1.3.4. Sluajni uzorak ( )1, , nX XK zove se prost ako su sluajne promjenljive ( )1, , nX XK nezavisne i jednako distribuirane, tj. svaka od njih ima funkciju distribucije ( )F x kao i obiljeje X. Pri tome je zajednika funkcija distribucije za ( )1, , nX XK zadana izrazom ( )( ) ( )( )( ) ( )11 , , 1

    1

    , , : , ,n

    n

    n X X n ii

    Q x x F x x F x=

    = =KK K .

    Popularno govorei, prosti sluajni uzorak znai da se statistiki pokus sastoji od n nezavisnih registriranja vrijednosti obiljeja X . Prije sprovoenja takvog pokusa vrijednosti

  • 12

    koje emo dobiti su sluajne veliine ( )1, , nX XK , a kada je pokus sproveden imamo brojeve ( )1, , nx xK (ili neke optije elemente), tj. realizovan je prosti sluajni uzorak. Kako emo se dalje baviti uglavnom prostim sluajnim uzorkom govoriemo kratko uzorak. Ako se radi o sloenom (stratifikovanom) uzorku posebno emo naglasiti. Primjer 1.3.3. U Primjeru 1.2.2. prost sluajni uzorak obima n moe se realizovati tzv. sluajnim uzorkom sa vraanjem (sa N jednakovjerovatnih ishoda): sluajno biramo kuglicu da bi realizovali obiljeje X, kuglicu vraamo nazad u kutiju, sluajno biramo kuglicu, itd. Pri tome su oigledno ( )1, , nX XK nezavisne sluajne veliine sa istom funkcijom raspodjele. No drugaija je situacija kod sluajnog uzorka bez vraanja. Naime, tada biramo kuglicu da bismo registrirali obiljeje X , a zatim kuglicu ne vraamo u kutiju ve biramo sluajno slijedeu kuglicu itd. Sluajne veliine ' '1, ... , nX X ( )n N ovako definirane nisu nezavisne, jer se pokazuje da je npr. vjerovatnoa dogaaja da je '2 1X = uz uslov da se desio dogaaj '1 1,X = razliita od vjerovatnoe dogaaja da je '2 1X = uz uslov da se desio dogaaj '1 0X = . Zapravo, u tom sluaju imamo:

    { } { }( ) { } { }( ){ }( ) { } { }( )' '2 1' ' ' '

    2 1 2 1'1

    1 1 11 1 1 01 11

    P X X N p N qP X X P X XN NP X

    = = = = = = = = = = = I

    Nije teko pokazati (primjenom formule potpune vjerovatnoe) da u ovom primjeru

    svaka sluajna veliina 'kX ( )1, ,k n= K ima istu distribuciju kao obiljeje X.

    1.4. Empirijska funkcija raspodjele (distribucije). Fundamentalna teorema statistike

    1.4.1. Empirijska funkcija raspodjele

    U cilju davanja odgovora na pitanje reprezentativnosti uzorka, tj. u kom sluaju uzorak ( )1, , nX XK daje potpunu informaciju o raspodjeli ( )F x obiljeja X na cijelom osnovnom skupu ; definira se prvo tzv. empirijska funkcija distribucije.

    Definicija 1.4.1. Neka je ( )1, , nX XK sluajni uzorak obima n iz funkcije distribucije

    F, tj. neka su ( )1, , nX XK nezavisne jednako distribuirane sluajne veliine sa zajednikom funkcijom distribucije F. Funkcija nF ( ili F

    ili stF ili nS ili empF ) definirana na R formulom

    ( ) ovabroj koji su manji od : in X xF x n= , ( )xR , tj. ( ) { }

    1

    1i

    n

    n X xi

    F xn

    =

    = < ili ( )i

    ni

    nx X

    fF xn

    =

    pod uslovom da je ( )F x neprekidna funkcija distribucije. Primjer 1.4.1. Nai empirijsku funkciju raspodjele prema datoj statistikoj raspodjeli:

    Rjeenje. Kako su ve sve varijante uzorka napisane po veliini, to datu tabelu ve moemo smatrati tablinim prikazom statistike raspodjele apsolutnih frekvencija. (Da bi odredili analitiki izraz empirijske funkcije distribucije moe se prvo dati tabelarni prikaz statistike raspodjele relativnih frekvencija.) Imamo:

    ( ) 0nF x = za 6x , ( )20in n= = , za 6 8x< je ( ) 0,1nF x = ,

    xi 6 8 12 15 (fi =) ni 2 3 10 5

  • 15

    za 12x8 < je ( ) 0,25nF x = , za 15x12 < je ( ) 0,75nF x = , za 15x > je ( ) 1nF x = , tj.

    ( )0, 6,0,1, 6 8,

    0, 25, 8 12,0,75, 12 15,1, 15.

    n

    xx

    F x xx

    x

    < = < < >

    Sl. 1.4.1.

    1.4.2. O karakteristinim funkcijama distribucije i tipovima konvergencije u teoriji vjerovatnoe

    Jedan vrlo moan matematiki aparat u teoriji vjerovatnoe, pa i u statistici, predstavlja metoda karakteristinih funkcija distribucije i u vezi s tim je izgraena itava teorija karakteristinih funkcija. Te se funkcije mogu korisno upotrijebiti u dokazima graninih teorema u teoriji vjerovatnoe i u njenim primjenama u statistici. Ovdje emo dati samo njenu definiciju i navesti njena osnovna svojstva.

    Definicija 1.4.3. Funkcija zove se karakteristina funkcija sluajne veliine X

    (ili karakteristina funkcija funkcije distribucije F, gdje je F funkcija distribucije sluajne veliine X na nekom prostoru vjerovatnoe ( ), ,F P ), ako je funkcija zadana izrazom ( ) ( ): itXt E e = ( i imaginarna jedinica), tj. ako je ( ) ( )itXt e dF x +

    = , ( )tR .

    Napomenimo da je itXe primjer kompleksne sluajne veliine ( ) :Z X iY = + C pri emu je kao to znamo ta sluajna veliina odreena parom ( ),X Y nezavisnih sluajnih veliina ,X Y , koji preslikava skup u C (gdje je C skup kompleksnih brojeva).

    Pokazuje se da karakteristina funkcija ima ova osnovna svojstva:

    1) ( ) 1t , ( )t ( )tR ; 2) je neprekidna ( )t ( )tR ;

    6 8 12 15 x

    1

    0

  • 16

    3) ( )0 1 = ; 4) ( ) ( )t t = , ( )t ( )tR ; 5) ( ) ( ) ( )0j j ji E X = , ( )j n , ako je ( )nE X < + , za neki nN ( izvod funkcije

    reda j u taki 0); 6) iz ( ) ( ): itXt E e = se dobije funkcija gustoe f: ( ) ( )1

    2itxf x e t dt

    +

    = , ( 1lim 1 , 2,718

    n

    ne e

    n = + ).

    Primjer 1.4.2. Lako se vidi da je funkcija 2

    2:t

    t e

    karakteristina funkcija normalne sluajne varijable.

    Definicija 1.4.4. Kaemo da niz { } 1n nX = sluajnih veliina konvergira gotovo

    sigurno (konvergira jako) prema sluajnoj veliini Y ako je

    ( ) ( ){ }( )lim 1nnP Y Y = = (tj. konvergira svuda osim eventualno na skupu vjerovatnoe 0). To se oznaava sa

    . .g snY y ( )n + ili (g. s.) ( ) ( )lim nn Y x Y x = .

    Definicija 1.4.5. Kaemo da niz { }nY sluajnih veliina konvergira po vjerovatnoi

    (konvergira slabo) ka sluajnoj veliini Y ako za svaki 0 > vrijedi relacija ( ) ( ){ }( )lim : 0nn P Y Y = ,

    to se simboliki oznaava sa PnY Y , ( )n ili ( ) ( ) ( )lim nnP Y x y x = .

    Osim ova dva tipa konvergencije u teoriji vjerovatnoe, pa i u statistici, posebno su znaajna i sljedea dva tipa.

    Definicija 1.4.6. Kaemo da niz { }nY sluajnih veliina konvergira po distribuciji

    ka Y ako je ( ) ( )limnY Yn

    F x F x = , za svaki ( )Yx C F , gdje je C(FY) skup svih taaka neprekidnosti funkcije distribucije FY sluajne veliine Y , a

    nYF je funkcija distribucije

    sluajne veliine Yn. To se simboliki esto pie u obliku nY Y

    F FD ( )n . Definicija 1.4.7. Neka je 1 p + i neka postoji konani apsolutni p-ti moment

    ( )pnE Y . Kaemo da niz { }nY konvergira u srednjem reda p prema Y ako je ( )lim 0pnn E Y Y = , to esto oznaavamo sa pmnY Y , ( )n .

    P

    mp g.s.

    D

  • 17

    Sl. 1.4.2. Posebno vaan sluaj konvergencije u srednjem je za 2p = , u kom sluaju se

    najee pie . .s knY Y , ( )n i kae da dati niz konvergira u srednjem, odnosno da je to srednjekvadratna konvergencija.

    Pokazuje se da su konvergencija gotovo sigurno i konvergencija u srednjem

    neuporedive (tj. jedna drugu ne implicira), dok obje impliciraju konvergenciju u vjerovatnoi, a ova implicira konvergenciju u distribuciji (a obrnuto ne vrijedi; tj. pokazuje se da vrijedi odnos konvergencija sluajnih veliina dat emom na sl. 1.4.2.

    1.4.3. O zakonima velikih brojeva, graninim teoremama i teoremama centralnog limesa u teoriji vjerovatnoe

    Zakon velikih brojeva je jedan od osnovnih i najznaajnijih zakona u statistici..

    Karakter i sadraj statistike kao nauke i prakse zasniva se na zakonu velikih brojeva. Osnovni smisao i znaenje zakona velikih brojeva u statistici moe se najjednostavnije izraziti u sljedeem: to je vei broj dogaaja, posmatranja ili elemenata to je vea vjerovatnoa da e nai sudovi i zakljuci biti realni, istiniti, odnosno to je manja greka u tanosti naih zakljuivanja. Pri tome treba voditi rauna da je primjena zakona velikih brojeva opta (generalna) u statistici, tj. ne treba shvatiti da to zavisi od metoda da li posmatranje i prebiranje vrimo putem potpunog obuhvatanja svih jedinica nekog osnovnog skupa ili samo putem djeliminog (selektivnog) posmatranja, odnosno, putem uzorka, tj. u svakom sluaju teimo da nae sudove i zakljuke temeljimo na zakonu velikih brojeva, samo to kod primjene metode uzorka to procjenjujemo sa manjim stepenom pouzdanosti nego kad to vrimo potpunim obuhvatanjem svih elemenata osnovnog skupa.

    U sutini, zakon velikih brojeva zasniva se na zakonima vjerovatnoe pa se i njihov dokaz izvodi tim putem.

    U klasinom obliku problematika zakona velikih brojeva sastoji se u ispitivanju

    potrebnog i dovoljnog uslova da niz aritmetikih sredina 1 211

    1, , ..., , ...2

    n

    ii

    X XX Xn =

    + nezavisnih sluajnih veliina 1, , nX XK K konvergira u odreenom smislu ka nekom broju. Ako se ne istakne suprotno, u daljem izlaganju smatramo da su sve sluajne veliine, koje se istovremeno posmatraju, definirane na istom prostoru vjerovatnoe ( ), ,F P . Sada emo preciznije formulisati zakon velikih brojeva: Neka je { }nX niz nezavisnih sluajnih veliina (definiranih na fiksnom prostoru vjerovatnoe ( ), ,F P ). Posmatra se konvergencija niza ( )

    1 1

    1 1n ni i

    i iX E X

    n n= = ( )1, 2,n = K ka 0 (ili, optije, niza

    nSn

    ili niza n nS an ka konsanti, gdje je

    1

    n

    n ii

    S X=

    = , na R , ( )1, 2,n = K ).

  • 18

    Ako je u pitanju konvergencija u vjerovatnoi odgovarajua teorema zove se slabi zakon velikih brojeva, a kod skoro sigurne konvergencije zove se strogi (jaki) zakon velikih brojeva.

    Neki osnovni zakoni velikih brojeva

    Pokazuje se da niz 1

    1 ni

    iX

    n = (Xi nezavisne) konvergira gotovo sigurno ka konstanti

    ili da divergira gotovo sigurno. Takoe se dokazuje da vrijede sljedei zakoni velikih brojeva (a i neki drugi, kao to su ebievljev zakon, Hinijev zakon /slabi zakoni/, te jaki zakon Kolmogorova i dr.).

    Teorema 1. 4.1. (Bernulijev slabi zakon velikih brojeva). U Bernulijevoj emi (tj.

    ako je nS ~ ( ),n pB , ili, to je isto, ako je Sn binomna sluajna veliina) za svaki 0 > vrijedi da je 0nSP p

    n

    , ( )n , tj. 1

    1 n Pi

    iX p

    n = , ( )n .

    (Ovaj zakon govori o konvergenciji po vjerovatnoi niza relativnih frekvencija u Bernulijevoj emi u svakom pojedinom pokusu. Ovaj zakon pretpostavlja klasian rezultat teorije vjerovatnoe i jedan je od prvih vanijih teorema teorije vjerovatnoe a objavljen je 1715. godine.) Dokaz. Prema poznatoj nejednakosti ebieva: Ako je X sluajna veliina sa konanim oekivanjem i varijansom na nekom prostoru vjerovatnoe ( ), ,F P , onda za svaki 0 > vrijedi da je ( ) ( ){ }( ) ( )2Var XP X E X , (a esto se koristi i Markovljeva nejednakost ( ){ }( ) ( ): rE XP X , 0r > , ( )rE X +< ), imamo:

    ( ) 22 2 21

    : 0

    n

    n

    SVar n p qS p qn nP pn n

    = = , n ,

    jer iz ( )( )nVar S n p q= i ( ) ( )2Var a X a Var X = slijedi da je 21nSVar n p qn n = . Prema tome, Bernulijev slabi zakon velikih brojeva je dokazan.

    Napomenimo jo da Bernulijev zakon velikih brojeva daje jedno tumaenje grupisanja

    relativnih frekvencija nSn

    oko vjerovatnoe p. Ali to grupisanje je opisano sljedeom jaom

    teoremom koju je dokazao Borel 1909. godine i zove se Borelov jaki zakon velikih brojeva.

  • 19

    Teorema 1.4.2. U Bernulijevoj emi (tj. za binomnu sluajnuveliinu nS ~ ( ),n pB ) vrijedi jaki zakon velikih brojeva dat sa ( ): , 1nSP p n

    n =

    , tj.

    . .1

    1 n g si

    iX p

    n = , ( )n .

    Dokaz. Dokazuje se primjenom ebievljeve nejednakosti i Borel-Cantellijeve leme I.

    Napomenimo da se u primjenama koristi i pooptena ebievljeva nejednakost data

    sljedeom teoremom. Teorema 1.4.3. (Kolmogorovljeva nejednakost). Ako su 1, , mX XK nezavisne sluajne veliine i ako je ( )jVar X + < za svaki 1, ,j m= K , onda za svaki 0 > vrijedi

    ( ){ }( ) ( )1, , 21

    1: maxn

    n m kk

    P Y Var X = = K , gdje je ( )( )1n

    n k kk

    Y X E X=

    = .

    Navedimo i ovaj (moni) jaki zakon velikih brojeva: Teorema 1.4.4. (Teorema Kolmogorova). I. Neka je ( )nX niz nezavisnih sluajnih veliina takav da je 1iX XF F= , ( )i , tj. sve

    iX su jednako distribuirane. Ako postoji ( )1E X , onda je ( ). .1 g si iX E Xn , ( )n .

    II. Obrnuto: Ako je 1lim 1inP X postojin = , onda ( )1E X postoji i prema I. je

    ( ). . 11

    1 n g si

    iX E X

    n = , ( )n , ili krae: Niz

    1

    1 ni

    iX

    n =

    , gdje su iX nezavisne i jednako distribuirane sluajne veliine, konvergira gotovo sigurno ako i samo ako

    ( )1E X postoji i u tom sluaju je ( )11

    1limn

    in iX E X

    n == .

    Dokaz. Izlazi iz okvira ovog kursa.

    Granine teoreme (teorem centralnog limesa) u teoriji vjerovatnoe

    U primjenama najee je potrebno izraunati vjerovatnou da neka sluajna veliina

    poprimi vrijednost iz nekog intervala kao npr. vjerovatnou da se broj uspjeha u Bernulijevoj emi (tj. ako je ( )~ ,X n pB (binomna sluajna veliina) ) nalazi izmeu realnih brojeva, recimo, a i b. Ta vjerovatnoa je

  • 20

    ( ) ( ) ( ) k n ka k b a k b

    np k P a X b P X k p q

    k

    = = = = . Brojeve ( )p k , a posebno ( )P a X b vrlo teko je izraunati za velike n. U tom

    smislu koriste se neke teoreme (granine) da se dobiju pribline vrijednosti ovih brojeva. Navedimo stoga slijedee vane (klasine teoreme) granine teoreme u teoriji vjerovatnoe:

    Teorema 1.4.5. (Poissonova teorema). Neka je nX ~ ( ),n pB ( )nN i lim 0nn p = , lim nn n p = , 0 > fiksan broj. Tada slijedi da za svaki 0,1, 2,k = K vrijedi

    ( )lim lim!

    kk n k

    n n nn n

    nP X k p q e

    k k

    = = = ,

    tj. imamo ( )!

    n

    kn

    nP X k ek = , ( ); 0,1, ,n nn p k n = = K , a koristi se ako je 20n , a

    10nn p < .

    Osim ove teoreme imamo dvije Laplaceove teoreme. Teorema 1.4.6. (Lokalna Moivre Laplaceova teorema). Neka je 0 1p< < i

    nX ~ ( ),n pB i neka je k k n pX n p q = , ( 0,k n= , nN ). Tada vrijedi

    ( )22

    2lim 1

    k

    nxn

    n p q P X k

    e

    = = ( ) i to uniformno na svakom ogranienom segmentu [ ],a b , gdje je ka x b za sve k i n .

    Dokaz. Uputa: Primjenjuje se Stirlingova formula ! 2 r r t rr r r e e = , 10

    12t r

    r< < . Napomenimo da se iz ( ) dobije praktina priblina formula

    ( ) ( )21 12

    k nn p

    n kP X k e f xn p q n p q = = .

    Teorema 1.4.7. (Integralna Moivre Laplaceova teorema). Neka je 0 1p< < i

    nX ~ ( ),n pB ( )nN . Tada za proizvoljne ,a bR il ,a bR , a b< , vrijedi 2

    21lim2

    b xn

    na

    X n pP a b e dxn p q

    = , tj. ( )0,1nX n pn p q

    D N ( )n . Dokaz. Moe se dokazati da je ova konvergencija u teoremi 4.4.7. uniformna u

    odnosu na ,a b , pri emu je a b + < . Teorema 1.4.7. je specijalan sluaj opte centralne granine teoreme. Poznati

    matematiar G. Polya je uveo naziv centralan da bi naglasio da je taj problem bio u centru istraivanja u teoriji vjerovatnoe u XVIII vijeku. Ali, etrdesetih godina ovog vijeka

  • 21

    dobijeno je potpuno rjeenje proirene verzije centralnog graninog teorema i taj dio teorije je jedan od najljepih dijelova teorije vjerovatnoe. Navedimo jednu od verzija opte teoreme centralnog limesa:

    Teorema 1.4.8. (Lvyjeva teorema centralnog limesa). Neka je nX niz nezavisnih

    sluajnih veliina jednake distribucije, tj. nX X

    F F= ( )n , sa oekivanjem ( )1E X = i ( ) 2nVar X = ( )20 < < . Tada za sve aR vrijedi

    2

    1 21lim2

    n

    ii

    n

    X nP a e dx

    n

    + =

    =

    ,

    ili krae ( )0,1nS nn

    N , gdje je

    1

    n

    n ii

    S X=

    = .

    Dokaz. Relativno lako se izvodi dokaz koristei metod karakteristinih funkcija i razvoja karakteristinih funkcija prema Taylorovoj formuli (MacLaurinovoj formuli), tj.

    koristei razvoj: ( ) ( ) ( ) ( )0 !

    knk n

    k

    itt E X o t

    k

    == + , ako ( )nE X postoji.

    10.4.4. Fundamentalna teorema statistike

    U okviru ove take dokaimo ranije navedenu fundamentalnu (centralnu) teoremu statistike.

    Teorema 1.4.9. (Fundamentalna teorema statistike). Ako je ( )F X funkcija

    distribucije sluajne promjenljive X (teoretska funkcija distribucije) i ( )nS X empirijska funkcija distribucije koja odgovara prostom uzorku ( )1, , nX XK , onda vrijedi:

    ( ) ( )sup 0 , 1nx

    P S X F X n +

    = < , ili recimo, imamo dovoljno razloga da pretpostavimo da X ima uniformnu raspodjelu na segmentu [ ]0,b , pri

  • 24

    emu je b nepoznat. Tada je familija raspodjela kojoj pripada raspodjela za X data sa ( ){ }0, , 0b b>U . Uopte, redovno pretpostavljamo da obiljeje X ima distribuciju

    (raspodjelu) koja pripada familiji distribucija ( ){ }, ,F x . Ova familija se naziva dopustiva familija distribucija, gdje parametar prolazi kroz skup dopustivih vrijednosti . ta emo usvojiti kao dopustivu familiju raspodjela u konkretnoj situaciji zavisi od nekih naih ranijih informacija i od problema koji nas interesuje. Izbor te familije je u optem sluaju subjektivan. Meutim, noviji pravac u statistici, tzv. Bajesovski prilaz, jo je ortodoksniji u tom smislu, jer on pretpostavlja da parametar koji odreuje raspodjelu ( ),F x obiljeja X pripada skupu pretpostavljajui jednu sluajnu veliinu sa nekom

    apriornom raspodjelom vjerovatnoe ( )G iji izbor zavisi od prethodnih informacija obiljeja X, tj. subjektivan je.

    1.6. Ocjene parametara po uzorku

    Neka sluajna veliina X ima distribuciju ( ),F x , gdje je nepoznat parametar.

    Pretpostavimo da treba ocijeniti parametar , odnosno da treba odrediti priblino njegovu vrijednost u zavisnosti od nekog uzorka 1: , , nn x xK . Oznaimo tu ocjenu sa . Oigledno zavisi od uzorka 1: , , nn x xK , tj. ( )1, , nX X = K . Kako u i-toj seriji iz n-ogleda uzima neku vrijednost i to se javlja kao sluajna veliina : R , te se moe govoriti o distribuciji (raspodjeli) te veliine, a i o njenim numerikim karakteristikama. Da bi ocjena nepoznatog parametra imala praktinu (upotrebljivu) vrijednost, na nju se postavljaju odreeni zahtjevi. Otuda imamo sljedee definicje o ocjenama parametara:

    Definicija 1.6.1. Ocjena ( )1, , nX X = K nepoznatog parametra zove se

    centrirana (nepristrasna, nepomjerljiva), ako je ( )E = . ( ) Ako svojstvo ( ) nije ispunjeno, onda je ocjena pristrasna i tada je ( )E = + ili ( )E = , gdje je pristrasnost.

    Eliminacijom pristrasnosti (odnosno ' = ) ili ' = dobije se nepristrasna ocjena. Definicija 1.6.2. Ocjena n parametra zove se asimptotski centrirana ako ( ) ,nE n .

    Definicija 1.6.3. Ocjena parametra zove se stabilna (postojana, konzistentna, mona) ako za proizvoljan 0 > vrijedi da je { }lim 1n P = , tj. P , n .

  • 25

    . Definicija 1.6.4. Nepristrasna i stabilna ocjena zove se najefektivnijom

    (najefikasnijom) ako ona ima najmanju varijansu (disperziju) od svih nepristrasnih i stabilnih ocjena parametra iz familije , tj.

    inf .Var Var

    = Napomenimo, da se esto efektivnost definira u klasi nepristrasnih ocjena (procjena).

    1.7. Grupisanje statistikih podataka. Numerike (statistike) karakteristike obiljeja

    1.7.1. Grupisanje statistikih podataka

    O grupisanju statistikih podataka govorili smo ranije kada smo definirali pojmove

    statistike raspodjele uzorka, te govorili o pojmovima grafikog metoda u statistici, (a i u teoriji vjerovatnoe). Neka je iz nekog statistikog skupa formiran uzorak od n elemenata

    1: , , nn x xK . Obino se taj uzorak prikazuje u obliku statistikog niza zadanom tabelom

    Da bi se izraunale numerike karakteristike kao to su: sredine uzorka (aritmetika, geometrijska, harmonijska, kvadratna i dr.), medijana, modus, statistiki momenti, kvartili, karakteristike poloaja, asimetrije ekscesa i dr. (na osnovu centralnog graninog teorema prirodno je oekivati da e ove uzorake karakteristike biti dobre ocjene za odgovarajue karakteristike osnovnog skupa) i ocjene raspodjele sluajne veliine X obino se vri grupisanje ovih podataka. Pri tome se u sluaju diskretne sluajne veliine vrijednosti ix

    poredaju po veliini i raunaju frekvencije mi ili imn

    (n obim) pojavljivanja sluajne veliine

    X. Kao rezultat dobije se tablica: tj. dobije se kao prikaz statistike raspodjele uzorka.

    Ako se radi o neprekidnoj sluajnoj veliini, podaci se grupiu tako da se interval posmatrane vrijednosti podijeli na k podintervala (podsegmenata) jednake duine: [ ]0 1 1, , , ,k kx x x x K i izrauna relativna frekvencija sluajnog dogaaja koji se sastoji u tome da sluajna veliina uzme vrijednosti u posmatranom intervalu. Tako se dobije tabela

    i 1 2 ... n xi x1 x2 ... xn

    xi x1 L xn mi m1 L mn

    xi x1 L xn i

    mn

    1mn

    L nmn

  • 26

    interval [ ]0 1,x x L 1,k kx x

    imn

    1mn

    L kmn

    pri emu je 1

    1k

    i

    i

    mn== .

    Broj podintervala se bira na osnovu iskustvenih formula, tako npr. moe se uzeti da je k

    najvei prirodni broj za koji je log1log 2

    nk + . Poreenjem poligona i kumulativa (empirijskih funkcija distribucije za diskretne i intervalne nizove) i histograma frekvencija za intervalne nizove sa graficima funkcija frekvencija (funkcije vjerovatnoe) i funkcija distribucije teoretskih raspodjela, moe se donijeti ocjena (pretpostavka) o raspodjeli posmatrane sluajne veliine.

    1.7.2. Osnovna sredina, sredina uzorka i ocjena oekivane sredine

    Svakodnevno ujemo da se govori o prosjeku plata radnika jedne fabrike, ili o srednjoj ocjeni uspjeha uenika jednog razreda i sl. Slobodno govorei, prosjek je srednji broj ili sredina oko koje se grupiu vrijednosti obiljeja, pa esto daje dobru obavijest o tom obiljeju. Pretpostavimo da treba izuiti obiljeje X za diskretni osnovni skup.

    Definicija 1.7.1. Osnovnom sredinom naziva se aritmetika sredina obiljeja X osnovnog skupa.

    Oznaimo osnovnu sredinu sa OX . Ako su sve vrijednosti 1, , nx xK obiljeja X osnovnog skupa obima N razliite, onda prema datoj definiciji imamo

    1

    1 NO i

    iX X

    N == . ( )1

    Ako se obiljeje (osobina) X razmatra kao sluajna veliine ije su mogue vrijednosti

    1, , nx xK sa istom vjerovatnoom 1pN

    = , onda je matematiko oekivanje takve sluajne

    veliine dato sa ( ) 1 21

    1 1 1 1 nn i

    iE X x x x x

    N N N N == + + + = L , tj. slijedi da je oekivanje

    obiljeja X dato izrazom ( ) OE x X= . ( )2

    Ako vrijednosti 1, , kx xK imaju respektivno frekvencuiju 1, , kN NK , pri emu je

    1

    k

    ii

    N N=

    = , onda je

  • 27

    1

    1 kO i i

    iX N X

    N == . ( )3

    Nije teko zakljuiti da jednakost ( )2 vai i za ovaj sluaj. Meutim, za neprekidnu raspodjelu obiljeja X uzima se po definiciji da je ( )OX E X= . ( )4

    Pretpostavimo da za izuavanje osnovnog skupa u odnosu na obiljeje X iz njega izdvojimo uzorak obima n. Tada se definiraju slijedei pojmovi (u skladu sa ranijim definicijama): Definicija 1.7.2. Sredina uzorka nX naziva se aritmetika sredina vrijednosti obiljeja uzorka. Ako su sve vrijednosti 1, , nx xK razliite, onda je

    1

    1 nn i

    iX x

    n == . ( )5

    Ako pak vrijednosti 1, , kx xK imaju, respektivno, frekvencije 1, , kn nK , pri emu je 1 kn n n+ + =L , onda je

    1

    1 kn i i

    iX n x

    n == . ( )6

    Kako je svaki uzorak obima n izvuen iz osnovnog skupa kome odgovara broj nX odreen sa ( )5 ili ( )6 , to se sredina uzorka moe smatrati kao sluajna veliina nX . Sredina uzorka uzima se kao kvalitetna ocjena osnovne sredine, jer se pokazuje da je ova ocjena nepomjerljiva i mona. Zapravo, pokazuje se da je (kao to smo vidjeli) ( )n OE X X= i da je

    ( )lim 1n On P X X =< za svaki 0 > . Otuda slijedi da pri neogranienom poveanju obima uzorka sredina uzorka tei po vjerovatnoi ka osnovnoj sredini. Posljednja jednakost znai da sredina uzorka predstavlja monu ocjenu osnovne sredine. Slijedi takoe, da su sredine uzorka, naene po vie uzoraka sa dovoljno velikim obimom iz nekog osnovnog skupa, jednake meusobno, to izraava svojstvo stabilnosti sredine uzorka.

    1.7.3. Osnovna disperzija, disperzija uzorka i empirijska disperzija

    Kao karakteristike rasijanja vrijednosti obiljeja X osnovnog skupa oko svoje srednje vrijednosti (ili u okolini svoje srednje vrijednosti) slue sljedei pojmovi: osnovna varijansa (disperzija) te osnovno kvadratno odstupanje (standardna devijacija), to se definira na sljedei nain:

    Definicija 1.7.3. Osnovnom srednjom disperzijom OD naziva se aritmetika sredina kvadrata odstupanja vrijednosti obiljeja X osnovnog skupa od njegove srednje vrijednosti OX . Ako su sve vrijednosti 1, , Nx xK obiljeja X osnovnog skupa obima N razliite, onda je prema datoj definiciji

    2

    1

    1 ( )N

    O i Oi

    D x XN =

    = , ( )

  • 28

    a ako vrijednosti 1, , kx xK imaju respektivno frekvencije 1, , kn nK , 1 kn n n+ + =L , onda je 2

    1

    1 ( )k

    O i i Oi

    D n x XN =

    = . ( ) Definicija 1.7.4. Osnovnim srednjim kvadratnim odstupanjem O naziva se

    kvadratni korijen osnovne disperzije OD , tj. O OD = (aritmetiki korijen). Kao karakteristike rasijanja vrijednosti osobine uzorka u okolini nX uvode se pojmovi

    disperzija uzorka i srednje kvadratno odstupanje uzorka. Definicija 1.7.5. Varijsnsom uzorka Var (X) (ili Disperzijom uzorka nD ) naziva se

    aritmetika sredina kvadrata odstupanja. Ako su vrijednosti 1, , nx xK obiljeja X uzorka

    obima n sve razliite, onda je 21

    1 ( )n

    n i ni

    D x Xn =

    = , a ako vrijednosti 1, , kx xK imaju respektivno frekvencije 1, , kn nK , za koje je 1 2 kn n n n+ + + =L , onda je

    2

    1

    1 ( )k

    n i i ni

    D n x Xn =

    = . Definicija 1.7.6. Srednje kvadratno odstupanje n uzorka definira se izrazom

    n nD = (aritmetiki korijen). Za izraunavanje disperzije uzorka moe se koristiti formula: ( )22n nD X X= , gdje

    je 1

    1 kn i i

    iX n x

    n == , 2 2

    1

    1 kn i i

    iX n x

    n == .

    Slino se dokazuje da vai da je: ( )22O O OD X X= , odnosno da vai ( ) 1n OnE D Dn

    = . Kako je oekivanje ( )n OE D D , to se disperzija uzorka nD javlja pomjerljivom (nije centrirana) ocjenom osnovne disperzije nD . Da bi dobili nepomjerljivu ocjenu (centriranu) osnovne disperzije OD , uvodi se pojam empirijske (ispravljene) disperzije 2S sljedeom definicijom:

    Definicija 1.7.7. Empirijska disperzija 2S definira se formulom 21 n

    nS Dn

    = . Otuda imamo da je

    2 2 2

    1 1

    1 1( ) ( )1 1

    k k

    i i n i i ni i

    nS n x X n x Xn n n= =

    = = . Kako je ( ) ( )2 1 1

    1 1n n O On n n nE S E D E D D D

    n n n n = = = = ,

    to je empirijska disperzija nepomjerljiva (nepristrasna) ocjena osnovne disperzije. Za ocjenu srednjeg kvadratnog odstupanja osnovnog skupa koristi se ispravljeno srednje kvadratno odstupanje ili empirijska standardna devijacija koja se definira formulom

  • 29

    2 2

    1

    1 ( )1 1

    n

    n ii

    nS S D x Xn n =

    = = = , tj. S je nepristrasna ocjena standardne devijacije O osnovnog skupa.

    Na kraju dokaimo da je ( ) 1n OnE D Dn= . Zaista, imamo:

    ( ) ( ) ( ) ( )( )2 22 21 1

    1 1( )k n

    nn k n k ni k

    E D E S E x X E X E Xn n= =

    = = = , a kako je

    ( )( ) ( ) ( )( )22 22 221 1

    1 1 1 1n nn k k i j

    k k i j

    nE X E X E X X X E X E Xn n n n= =

    = = + = + ,

    to imamo:

    ( ) ( ) ( )( )2 22 21 1 1n n n nE S E X E Xn n n = = , .t.d.

    1.7.4. Statistiki parametri sluajne veliine (statistikog obiljeja) Najvaniji statistiki parametri sluajne veliine (statistikog obiljeja) su njena srednja

    vrijednost (matematiko oekivanje) i standardna devijacija odnosno varijansa (disperzija). Tu se mogu ubrojati i ostali momenti sluajne veliine. Osim toga uvode se jo neki parametri (medijana, moda i dr.).

    Neka je X sluajna veliina (statistiko obiljeje) na proizvoljnom prostoru vjerovatnoe (, F, P) i XF njena funkcija distribucije (definirana formulom ( ) ( )XF x P X x= . Medijan(a) sluajne veliine (statistikog obiljeja) X, u oznaci Me, je broj X takav da vrijedi

    1 1( ) ( )2 2X X

    P X P X , tj. 1( ) ( )2X X X X

    F F . (*) Oigledno je da medijana sluajne veliine uvijek postoji, ali valja primijetiti da ona ne

    mora biti jedinstvena. Npr., ako je 1 ,2

    0, 0,

    , 0 1

    1, 1,

    ( ):X

    x

    x

    x

    F x ) sluajne veliine (statistikog obiljeja) X je broj rm definiran formulom | | d ( )

    rrm x F x

    +

    = . Broj r ( 0r> ) definiran formulom

    ( ( )) d ( )rr x E X F x+

    = nazivamo centralni moment reda r sluajne veliine (statistikog

    obiljeja) X, a broj r ( 0r> ) definiran formulom | ( ) | d ( )rr x E X F x+

    = nazivamo

    apsolutni centralni moment reda r sluajne veliine (statistikog obiljeja) X . Primijetimo da je E(X) = 1m , Var (X) =

    22 2 1m m = .

    Pomoni momenti distribucija predstavljaju odstupanja pojedinanih vrijednosti

    sluajne veliine (statistikog obiljeja) od nule, podignuta na odreeni stepen.

    Za neprekidne sluajne veliine (neprekidna statistika obiljeja) u pretodnim formulama za momente vrijedi da je d ( ) ( )d ( )dF x F x x f x x= = , gdje je f funkcija gustoe sluajne veliine X, dok se za diskretnu sluajnu veliinu (diskretno statistiko obiljeje) X prethodni integrali svode na odgovarajue konane sume ili beskonane sume (sume beskonanih redova), tj. vrijede formule

    , | | , ( ( )) , | ( ) |r r r rr i i r i i r i i r i i

    i i i i

    m x p m x p x E X p x E X p = = = = .

    Formulom 33 3 = definira se koeficijent asimetrije kao numeriki pokazatelj koji

    izraava u kojoj meri je neka distribucija (raspodjela, razdioba, raspored) asimetrina u odnosu na normalnu (Gaussovu) distribuciju.

    Ako je: 3 = 0, distribucija je simetrina, 3 > 0, distribucija je asimetrina udesno (pozitivna asimetrija), 3 < 0, distribucija je asimetrina ulijevo (negativna asimetrija). U zavisnosti od veliine koeficijenta asimetrije, odreuje se i jaina asimetrije. Gradacija

    je sljedea: | 3 | 0,25 mala asimetrija, 0,25 < | 3 | 0,50 srednja asimetrija, | 3 | > 0,50 jaka asimetrija.

  • 33

    Formulom 44 4 = definira se koeficijent spljotenosti kao numeriki pokazatelj koji

    izraava u kojoj meri je neka distribucija (raspodjela, razdioba, raspored) spljotena u odnosu na normalnu (Gaussovu) distribuciju.

    Na osnovu ove formule, koeficijent spljotenosti prua sljedeu informaciju: 4 = 3, raspored je normalno spljoten (zaobljen), 4 > 3, raspored je vie izduen u odnosu na normalnu distribuciju, 4 < 3, raspored je vie spljoten u odnosu na normalnu distribuciju .

    Formulom 100V = definira se koeficijent varijacije statistikog obiljeja za osnovni

    skup, a formulom 100uVuX= definira se koeficijent varijacije statistikog obiljeja za

    uzorak kao relativna mjera varijacije koja pokazuje koliko procenata iznosi standardna devijacija od aritmetike sredine.

    Formulom XU = definira se normalizovano (standardizovano) odstupanje (z-skor)

    za osnovni skup, a formulom 100uuU X= definira se normalizovano (standardizovano)

    odstupanje (z-skor) za uzorak kao mjera varijacije koja pokazuje odstupanje jedne vrijednosti statistikog obiljeja od aritmetike sredine u standardnim devijacijama.

    Neka je X sluajna veliina (statistiko obiljeje) na proizvoljnom prostoru vjerovatnoe

    (, F, P) i 0r> . Po dogovoru je 0 0( ) (| | ) 1.E X E X= = Kao mjeru prosjenog odstupanja sluajne veliine X od njene srednje vrijednosti X (oekivanja E(X)) uveli smo standardnu devijaciju . Ovdje nas zanima vjerovatnoa velikih odstupanja X od X , npr. vjerovatnoa da to odstupanje bude vee od k . U tom smislu pokazuje se da vrijede sljedee injenice:

    Propozicija 1.7.1. (Nejednakost Markova). Neka je 0r> i (| | )rE X vrijedi nejednakost (| | )(| | )

    r

    r

    E XP X . Propozicija 1.7.2. (Nejednakost ebieva). Neka je X sluajna veliina s konanim oekivanjem i varijansom. Tada za proizvoljan 0> vrijedi nejednakost

    2

    ( )(| | ) Var XP X X .

    Zamjenom k = ( 0k > ) u prethodnu nejednakost dobijemo nejednakost 2

    1(| | )P X X kk

    ,

  • 34

    koja pokazuje da kakva god bila distribucija vjerovatnoe sluajne veliine (statistikog obiljeja) za koju je definirana varijansa vjerovatnoa velikih odstupanja sluajne veliine X od njene srednje vrijednosti X (oekivanja E(X)) je mala, i tei nuli kad k + . S praktine strane gledanja moe se konstatovati da su odstupanja sluajne veliine (statistikog obiljeja) od nekoliko standardnih devijacija od srednje vrijednosti veoma malo vjerovatna, to predstavlja opti rezultat. Meutim, za konkretne distribucije vjerovatnoe mogu se dobiti preciznije procjene. Tako, npr., za Gaussovu distribuciju se pokazuje da je vjerovatnoa odstupanja (X od X ) od 3 mnogo manja od vrijednosti koja se dobije primjenom ebievljeve nejedenakosti. Propozicija 1.7.3. Neka je X sluajna veliina i g nenegativna Borelova funkcija takva da je ( ( ))E g X vrijedi nejednakost

    ( ( ))( )( )

    E g XP Xg

    . Dokaz: Neka je { }: | |A X = . Tada je ( ( )) ( )d ( )d ( ) d ( ) ( ).

    cA AA

    E g X g X P g X P g P g P A = + = Q.E.D.

    Neka je ( )1: ,... , nX X X= n dimenzionalna sluajna veliina (n - dimenzionalni sluajni vektor) (odnosno n-dimenzionalno statistiko obiljeje) na proizvoljnom prostoru vjerovatnoe (, F, P). Tada se matematiko oekivanje od X definira formulom

    ( )1( ): ( ),... , ( ) nnE X E X E X R= uz pretpostavku da je ( )iE X R za svaki i = 1, . . . , n . Za sluajni vektor , uz oekivanje, najvaniji su momenti drugog reda. Neka je

    2( )iE X

  • 35

    Uslovna funkcija distribucije sluajne veliine (statistikog obiljeja) X uz uslov da se desio dogaaj A definira se formulom

    { } )(( | ): ( | )( )X

    AP X xF x A P X x A

    P A= = ,

    a uslovna funkcija gustoe od X uz uslov da se desio dogaaj A zadana je formulom

    { }0 0

    )( / 2 / 2 | ) ( / 2 / 2( | ): lim lim .( )X x x

    AP x x X x x Ax

    P x x X x xf x A

    x P A + + < < +

    < < += =

    Uslovna funkcija distribucije i uslovna funkcija gustoe od X uz uslov da se desio dogaaj A imaju ista svojstva kao i odgovarajue bezuslovne funkcije, a analogno se uvode i pojmovi uslovne srednje vrijednosti (uslovnog oekivanja), uslovne varijanse i , openito, uslovnih momenata. Tako, npr., uslovna funkcija distribucije je neopadajua funkcija i neprekidna zdesna na R.

    1.7.5. Neki primjeri zadataka za ponavljanje i utvrivanje gradiva Zadatak 1.7.1. Zadana je raspodjela apsolutnih frekvencija sluajnog uzorka :

    a) Odrediti raspodjelu relativnih frekvencija , empirijsku funkciju raspodjele 30 ( )F x , a zatim skicirati grafik dobijene funkcije 30 ( )F x . b) Nai matematiko oekivanje, disperziju, standardnu devijaciju i empirijsku disperziju prema zadanoj statistikoj raspodjeli apsolutnih frekvencija sluajnog uzorka. Zatim konstruisati poligon i histogram relativnih frekvencija zadanog sluajnog uzorka. Zadatak 1.7.2. a) Za proizvoljan uzorak obiljeja X , zadan tabelom (statistikom raspodjelom)

    xi 1x 2x ... kx 1kx + ... nx

    ii

    npn

    = 1p 2p ... kp 1kp + ... np izraunati medijanu. b) Na osnovu a) izraunati medijanu i (aritmetiku) sredinu uzorka zadanog sljedeom tabelom:

    xi 0 1 2 3 4 ni 36 38 18 6 2

    xi 6 8 12 15

    (fi =) ni 2 15 5 8

  • 36

    Koliki su koeficijenti/mjere asimetrije ( 3 ) i zaobljenosti (spljotenosti, 4 ) posmatrane distribucije?

    Zadatak 1.7. 3. Statistika raspodjela sluajnog uzorka hidroloke veliine (statistikog obiljeja) X zadana je sljedeom tabelom:

    xi 10 8 12 14 16 20 18 ni 15 16 5 24 10 17 13

    a) Odrediti (empirijske) statistike momente i pokazatelje disperzije vieg reda (obine

    statistike momente 1

    1 k rr i i

    im x f

    n == , centralne statistike momente

    1

    1 ( ) ,k

    rr i i

    iM x X f

    n == za

    3, 4,5r = i centralni apsolutni moment 3. reda zadanog obiljeja X . b) Izraunati karakteristike poloaja, asimetrije, ekscesa i druge vane uzorake karakteristike, pa dati ocjene za odgovarajue karakteristike itavog osnovnog skupa. Zadatak 1.7. 4. Na jednoj stonoj farmi je statistiki posmatrana mlijenost stotinu krava, tj. broj X hl mlijeka koje svaka krava daje godinje. Podaci su prvo sreeni, pa su onda napisani u sljedeoj tabeli. Nacrtati odgovarajui dijagram frekvencija i histogram frekvencija, te izvesti odgovarajue prirodne zakljuke.

    Klase

    obiljeja x

    Sredina Klase

    Broj krava

    f

    Relativna frekvencija

    f / 100 29 - 31 30 2 0,02 31 - 33 32 10 0,1 33 - 35 34 18 0,18 35 - 37 36 30 0,3 37 - 39 38 22 0,22 39 - 41 40 13 0,13 41 - 43 42 3 0,3 Ukupno 100 1

    Zadatak 1.7.5. Zadana je zajednika funkcija vjerovatnoe (dvodimenzionalne)

    sluajne veliine (X, Y) :

    X \ Y - 3 2 4 1 3

    0,1 0,3

    0,2 0,1

    0,2 0,1

    Odrediti analitike oblike i grafiki predstavite marginalne funkcije vjerovatnoe i njihove odgovarajue funkcije distribucije, te izraunati oekivanja E(X) i E(Y) i kovarijansu C (X, Y). Zadatak 1.7.6. Funkcija raspodjele/distribucije obiljeja X neke populacije zadana je formulom

  • 37

    a)

    0, 0,2

    ( ) : , 0 2 ,4

    1, 2;

    x

    xF x xX

    x

    =

    Odredite koeficijent A i analitiki oblik funkcije distribucije FX , a zatim izraunajte matematiko oekivanje, varijansu i standardnu devijaciju zadane sluajne varijable X, te skicirajte grafike funkcija f X i FX .

    Uputa. Iz ( ) d 1X

    f x x+

    = slijedi da je A = 2 2h , pa iz

    ( )E X = ( ) dX

    x f x x+

    i ( )22( ) ( ) ( )V ar X E X E X= dobijemo oekivanje ( )E X i varijansu ( )V ar X

    Zadatak 1.7.10. Zadana je zajednika funkcija vjerovatnoe (dvodimenzionalne) sluajne promjenljive veliine (X, Y ) :

    Odredite analitike oblike i grafiki predstavite marginalne funkcije vjerovatnoe i njihove

    X \ Y - 3 2 4 1 3

    0,1 0,3

    0,2 0,1

    0,2 0,1

  • 38

    odgovarajue funkcije distribucije, te izraunajte oekivanja E (X) i E(Y) i kovarijansu C (X, Y). Zatim ispitajte zavisnost zadanih sluajnih veliina X, Y i odredite oekivanje sluajne veliine : 2 5Z X Y= . Rezultat. Marginalne funkcije vjerovatnoe f i g sluajnih veliina X i Y su zadane sljedeim tabelama: E (X) = 2, E(Y) = 0, 6; C (X, Y) = - 1,2; ( ) 2 ( ) 5 ( ) 2 2 5 0, 6 1E Z E X E Y= = = . Iz (1) 0, 5, ( 3) 0, 4, (1, 3) 0, 1,f g h= = = gdje je h zajednika funkcija vjerovatnoe, slijedi da je (1, 3) (1) ( 3)h f g , pa su sluajne veliine X i Y zavisne.

    jy - 3 2 4 ( )jg y 0,4 0,3 0,3

    ix 1 3 ( )if x 0,5 0,5

    Jo o pojmu statistikog skupa i statistike raspodjele 1.7.5. Neki primjeri zadataka za ponavljanje i utvrivanje gradiva Zadatak 1.7. 3. Statistika raspodjela sluajnog uzorka hidroloke veliine (statistikog obiljeja) X zadana je sljedeom tabelom: Odrediti vrijednost konstante a, mod(us), medijan(u), (aritmetiku) srednju vrijednost, varijansu i analitiki oblik funkcije gustoe vjerovatnoe za zadanu sluajnu varijablu (obiljeje) X , a zatim skicirati grafike funkcija i .