79
UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE 5 STATISTICS PRELIMINARY ANALYSIS AND THEORETICAL BASIS BINOMIAL DISTRIBUTION Bernoulli experiment

BINOMNA RASPODJELA

Embed Size (px)

DESCRIPTION

Autor: mr. sc. Mulahasanović Remzija Ovaj članak raspravlja (o značaju diskretnih raspodjela) s kratkim osvrtom na teorijske osnove Bernoullijeva procesa koji u najširem smislu analizira geometrijsku interpretaciji uzorka p, a zatim u kontekstu zakona velikih brojeva ukazuje na prebrojiv i neprebrojiv skup varijable k Bernoullijeva procesa. Jedan od tih pokazatelja je i reprodukcija geometrijske interpretacije u ravnini i prostoru sa primjerima vjerovatnosti varijable k, i povezanosti varijable k s uzorkom tačaka diferenciranih vjerovatnosti dp i dq.

Citation preview

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    5

    STATISTICS

    PRELIMINARY ANALYSIS AND THEORETICAL BASIS

    BINOMIAL DISTRIBUTION

    Bernoulli experiment

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    6

    Pregledni rad

    STATISTIKA

    UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE

    RASPODJELE

    Bernoullijev eksperiment

    mr. sc. Mulahasanovi Remzija

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    7

    The Binomial distribution

    Abstract

    Binomial distribution sometimes called Bernoulli distribution in honor of the Swiss

    mathematician Jacob Bernoulli (1654 - 1705), which is truly established the

    theoretical basis of binomial distribution.

    This article discusses (on the importance of discrete distribution) with a brief

    review of the theoretical basis of the Bernoulli process that in the broadest sense

    analyze the geometric interpretation of the pattern p, and then in the context of the

    law of large numbers indicates a countable and uncountable set of variables to a

    Bernoulli process. One of these indicators is the reproduction of geometric

    interpretation in plane and space with examples of probability variables k, and

    relationship variables k patterned dots differentiated probability dp and dq.

    In the broadest sense, the work examines the properties of discrete size Bernoulli

    experiment (process), such as: table of binomial distribution, the probability of

    outcomes (independent events) and the cumulative probability that make (binomial

    probability distribution, the probability of the individual and the value of the partial

    sum, the cumulative probability, as well as samples binomial distribution with

    examples of p). Previous activities during the reading of the text the reader refer to

    the three approaches (interpretation) n series of Bernoulli process.

    a) Assumptions Bernoulli experiment

    Each study (decipher) has two possible outcomes, heads or tails. Furthermore, no

    matter how many times he repeated this experiment, the probability of outcomes,

    heads or tails remains the same.

    Express an experiment in statistical terms. Properties Experiment E - (Bernoulli

    process) are fully consistent trials (with two possible outcomes): success (U), and

    failure (N). Thus, the outcome - head can be considered a success, and the outcome

    - the letter is considered a failure. Probability of success or failure to express the

    functions of probability:

    P(S) = p; and P(F) = 1- p = q

    Investigations are independent, which means that no matter how many times he

    repeated the experiment, the probability of success or failure ostataje same.

    Repeated independent experiments with characteristics:

    (1) There are only two possible outcomes, and

    (2) The likelihood of the outcome remains the same for all attempts.

    The Binomial Distribution VII

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    8

    b) Patterns of distribution and hypotheses

    Any serious analysis of binomial distribution is based on a sample ps shares and

    three interpretations of a series of Bernoulli process, ie it approaches:

    a) The first approach ''k'' is considered a random variable.

    b) The second approach considers a number of independent random variables and redefined ''k'' discrete variable

    c) The third approach we shall discuss considered distribution.

    Tests binomial distribution are always based on calculations of variables p*, while

    the OC curve (Operating Characteristic Curves) with parameters estimation

    variance and the mean of the sample p serve the evidentiary test procedures. All

    practical examples using tables Clopper - Pearson, tables published by the National

    Bureau of Standards USA.

    Keywords:

    Bernoulli experiment, Binomial distribution, population samples, sample p (known

    and constant probability), approximation of binomial distributions, hypothesis, and

    the effect of increasing the sample size to the OC curve (Operating Characteristic

    Curves).

    The Binomial Distribution VIII

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    9

    BINOMNA RASPODJELA

    Saetak: Binomnu raspodjelu ponekad nazivamo Bernoullijevom raspodjelom u

    ast vicarskog matematiara: Jacob Bernoulli (1654 1705), a koji je istinski

    utemeljio teorijske osnove binomne raspodjele.

    Ovaj lanak raspravlja (o znaaju diskretnih raspodjela) s kratkim osvrtom na

    teorijske osnove Bernoullijeva procesa koji u najirem smislu analizira

    geometrijsku interpretaciji uzorka p, a zatim u kontekstu zakona velikih brojeva

    ukazuje na prebrojiv i neprebrojiv skup varijable k Bernoullijeva procesa. Jedan od

    tih pokazatelja je i reprodukcija geometrijske interpretacije u ravnini i prostoru sa

    primjerima vjerovatnosti varijable k, i povezanosti varijable k s uzorkom taaka

    diferenciranih vjerovatnosti dp i dq.

    U najirem smislu rad istrauje svojstava diskretnih veliina Bernoullijeva

    eksperimenta (procesa), kao to su: tablice binomne raspodjele, vjerovatnost

    ishoda (neovisnog dogaaja) i kumulativne vjerovatnosti koje ine (vjerovatnosti

    binomne raspodjele, pojedinane vjerovatnosti i vrijednost djeliminog zbira,

    kumulativnu vjerovatnost, kao i uzorke binomne raspodjele s primjerima udjela p).

    Prethodni sadraji e tokom isitavanja teksta itaoca uputiti na tri pristupa

    (tumaenja) n niza Bernoullijeva procesa.

    a) Pretpostavke Bernoullijeva eksperimenta

    Svako ispitivanje (prosudimo) ima dva mogua ishoda, glava ili pismo. Nadalje,

    bez obzira na to koliko puta je ponovljen ovaj eksperiment, vjerovatnost ishoda,

    glava ili pismo ostaje ista.

    Izrazimo eksperiment u statistikoj terminologiji. Svojstva eksperimenta E

    (Bernoulli proces) u cijelosti su saglasna ispitivanjima (sa dva mogua ishoda):

    uspjeh (U), i neuspjeh (N). Dakle, ishod - glava se moe smatrati uspjehom, a

    ishod - pismo se smatra neuspjeh. Vjerovatnost uspjeha ili neuspjeha izraavamo

    funkcijama vjerovatnosti:

    ( ) i ( )

    Istraivanja su neovisna, to znai da bez obzira na to koliko puta je ponavljan

    eksperiment, vjerovatnost uspjeha ili neuspjeha ostataje ista.

    Ponovljeni nezavisni eksperimenti koji imaju karakteristike:

    (1) Postoje samo dva mogua ishoda, i

    (2) Vjerovatnost ishoda ostaje ista za sve opite.

    The Binomial Distribution IX

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    10

    b) Uzorci raspodjele i hipoteze

    Svaka ozbiljna analiza binomne raspodjele poiva na uzorku p s udjelima i tri

    tumaenja niza Bernoullijeva procesa, odnosno to su pristupi:

    (a) Prvi pristup ''k'' smatra sluajnom varijablom. (b) Drugi pristup smatra niz nezavisnih sluajnih varijabli i redefinirani ''k''

    diskretnom varijablom (c) Trei pristup o kojem emo razgovarati smatra raspodjelom.

    Testovi binomne raspodjele uvijek su utemeljeni na izraunima varijable p*, dok

    e OC krivulje (Operating Characteristic Curves) s parametrima procijena

    varijance i srednje vrijednosti uzorka p posluiti u dokaznim procedurama testa.

    Svi praktini primjeri koriste Tablice Clopper Pearson, tablice je objavio

    Nacionalni uredu za standarde SAD.

    Kljune rijei:

    Bernoullijev eksperiment, Binomna raspodjela, uzorci populacije, uzorak p

    (poznata i konstantna vjerovatnoa), aproksimacija binomne raspodjele, hipoteza,

    i uinak poveane veliine uzorka na OC krivulje (Operating Characteristic

    Curves).

    The Binomial Distribution X

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    11

    S a d r a j

    Uvod.................................................................................................

    14

    I - Teorijske distribucije........................................................

    15

    1-1 Geometrijska interpretacija..............................................................

    15

    1-2 Binomna raspodjela..........................................................................

    17

    II - Tablice binomne raspodjele............................................

    20

    2-1 Tablice vjerovatnosti binomne raspodjele........................................

    20

    (i) Pojedinane vrijednosti i vrijednosti djeliminog zbira........

    20

    (ii) Kumulativne vjerovatnosti.....................................................

    22

    III - Uzorci raspodjele s udjelima vjerovatnosti...................

    25

    3-1 Uzorak raspodjele s primjerima uzorka p........................................

    25

    (i) Tri tumaenja n niza Bernoulijeva procesa...........................

    26

    (ii) Varijanca uzorka....................................................................

    29

    (iii) Raspodjela uzorka p u n - dimenzionom prostoru (2

    4 = 16)

    30

    (iv) Srednja vrijednost i varijanca uzorka p.................................

    33

    IV Hipoteze i testovi...........................................................

    35

    4-1 Testovi binomne raspodjele..............................................................

    35

    (i) Ispitivanje hipoteze................................................................

    36

    (ii) Clopper - Pearson .................................................................

    37

    (iii) Koordinatni sistem uzorka p..................................................

    42

    V OC krivulja (Operating Characteristic Curves)............

    45

    5-1 Hipoteze i izraun p*........................................................................

    45

    (i) Izraun p* .............................................................................

    46

    (ii) OC krivulja.............................................................................

    51

    (iii) Upotreba OC krivulje............................................................

    54

    5-2 Procijena ................................................................................

    56

    (i) Procijena .............................................................................

    56

    (ii) Procijena varijance................................................................

    57

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    12

    VI - Normalna aproksimacija binomne raspodjele.............

    60

    6-1 Normalna distribucija (priblina binomna distribucija)..................

    61

    6-2 Interval pouzdanosti.........................................................................

    67

    (i) Postupak primjene standardne procedure.............................

    68

    (ii) Metoda procijene...................................................................

    69

    (iii) Postupak koritenja dvolane vjerovatnosti..........................

    71

    (iv) Interval pouzdanosti (Clopper Pearson)............................

    73

    6-3 Veliina uzorka n (koritenje intervala pouzdanosti).......................

    74

    Dodatak............................................................................................

    78

    The Binomial Distribution XII

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    13

    I n t r o d u c t i o n

    The world in which we live and who we want to understand the full diversity and

    ambiguity. Human cognition and general perception of man will hardly anytime to

    be absolutely identical, one person will say iteresovati local geography, while

    another person iteresovati some general properties (attributes) of a number of

    transformations in nature or society (which are both long-term). When it would not

    be so, it would be a slight area of statistics.

    Statistics teaches us how to make conclusions and decisions in the world of

    ambiguity on the basis of information collected on the observed phenomena, but in

    accordance with the methods and goals of statistical surveys. How collected

    information about occurrences organize and then treat (we assume that we collect

    and process a lot of information). Thus, the statistics would indicate methods for

    organizing, collecting information and concise interpretation and inferences based

    on information collected and processed statistical surveys.

    Methods of statistical research (as well as methods of binomial distribution) are

    part of the inductive statistics (used methods of statistical inference), then based on

    the properties of the sample to a conclusion on the entire population. Thus,

    methods of statistical research and test sample ambiguity and population are

    correlated.

    The Binomial Distribution XIII

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    14

    U v o d

    Svijet u kojem ivimo i koji elimo razumjeti pun je razliitosti i neodreenosti.

    Ljudska spoznaja i opta percepcija ovjeka teko da e bilo kada biti apsolutno

    podudarna, jednu osobu e recimo iteresovati blia okolina, dok e drugu osobi

    iteresovati neka opta svojstva (atributi) brojnih transformacija u prirodi ili drutvu

    (koja su istovremeno i dugorona). Kada to ne bi bilo tako, bilo bi neznatno

    prostora za Statistiku.

    Statistika nas pouava kako donositi zakljuke i odluke u svijetu neodreenosti na

    osnovu prikupljenih informacija o promatranoj pojavi, ali u skladu sa metodama i

    ciljevima statistikih istraivanja. Kako prikupljene informacije o nekoj pojavi

    organizovati a zatim obraditi (pretpostavimo da prikupljamo i obraujemo

    mnotvo informacija). Dakle, statistika e nam ukazati na metode za

    organizovanje, prikupljanje informacija i saeto interpretiranje, te izvoenje

    zakljuka na osnovu prikupljenih i obraenih informacija statistikih istraivanja.

    Metode statistikih istraivanja (kao i metode binomne raspodjele) dio su

    induktivne statistike (koristi metode statistikih zakljuivanja), tada na temelju

    svojstava uzorka izvodimo zakljuak o cijeloj populaciji. Dakle, metode

    statistikih istraivanja kao i ispitivane neodreenosti uzorka i populacije su u

    korelaciji.

    The Binomial Distribution XIV

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    15

    I Teorijske distribucije

    Distribucije koje su formirane grupiranjem opaanja ili elemenata skupa prema

    nekom obiljeju nazivamo orginalnim (empirijskim) distribucijama. Dok emo

    distribucije koje se mogu oekivati u skladu sa naim iskustvom ili na temelju

    nekih teorijskih postavki nazivati teorijskim distribucijama.

    Teorijske distribucije:

    (a) Pretpostavljamo u nekom statistikom modelu ili ih postavljamo kao

    hipotezu koju treba ispitati (dokazati).

    (b) Definirane su analitiki, te su unapred poznata svojstva: sredina, mod,

    medijan, itd.

    (c) Pojavljuju se u ulozi distribucije vjerovatnosti.

    Distribucije vjerovatnosti (kao to je binomna distribucija) su apriori vjerovatnosti kod

    kojih moemo izraziti ukupno mogue ishode i broj povoljnih ishoda, no sobzirom na

    brojne zadatke statistikih istraivanja (kada nisu poznate apriori vjerovatnosti), pa je

    eksperimentom potrebno doi do vjerovatnosti, tj. naknadno a posteriori, tako

    proraunate (poslije) vjerovatnost iskazane su empirijski ili statistiki.

    1-1 Geometrijska interpretacija

    Neka je slijedee tumaenje Bernoullijeva eksperimenta geometrijsko. Ponimo s

    jednostavnim primjerima: dva bacanja i tri bacanja novia. A zatim analizirajmo

    opte tumaenje Bernoullijeva eksperimenta.

    Dva bacanja novia

    Pretpostavljamo da je novi bacan dva puta. Dakle, mogua su koja emo predstaviti (simbolino) kao: ( ) ( ) ( ) ( ) Ovu kombinaciju ishoda (koje oekujemo) moemo predstaviti u 2 dvodimenzionalnoj

    ravnini kao uzorak u ravnini: Slika 1-1.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    16

    Vjerovatnosti povezane s uzorkom taaka:1

    P(G,G) = pp q =

    P

    P(G,P) = pq

    P(P,G) = qp p=

    G

    P(P,P) = qq

    G P

    Slika 1-1

    Tri bacanja novia

    Predpostavljamo da je novi bacan tri puta. Sada su mogua ili take po uzorku, koje emo predstaviti (simbolino) kao:

    ( ) ( ) ( ) ( )

    ( ) ( ) ( ) ( )

    Ovu kombinaciju ishoda (ishode koje oekujemo) predstavit emo u

    3 trodimenzionalnom prostoru: Slika 1-2; vjerovatnosti povezanh uzorak taaka,2

    na primjer: P(G,G,G) = ppp; P(G,G,P) = ppq; P(G,P,G) = pqp; P(P,G,G) = qpp,

    itd.

    ---------------------------------------------------

    Podnaslov prethodnog teksta (Geometrijska interpretacija) je preuzet u slobodnom

    prevodu izvornog naslova studije: Taro Yamane, STATISTIC An Introductory Analysis.

    Sistem moguih ishoda (diskretnih stanja) za dva bacanja novia razvijen je u ravnini,

    dok je sistem moguih (diskretnih stanja) za tri bacanja novia razvijen u prostoru.

    1 Taro Yamane, Statistics An Introductory Analysis, Harper & Row, Publishers, p.

    679;

    2 Taro Yamane, Statistics An Introductory Analysis, Harper & Row, Publishers, p.

    680.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    17

    Indukcijom zakljuujemo, ako se novi baca n

    puta, ponavljamo n puta Bernoullijev proces, a to

    generira n dimenzionalni uzorak prostor (uzorak take).

    Svaka taka uzorka daje mogui slijed ishoda:

    glave (G) ili pisma (P), to su moguie sekvence (niz), tada i samo tada, kada smo n puta ponavljali

    Bernoullijev proces. Vjerovatnosti povezane s

    ovim uzorkom taaka moe se prikazati algebarski

    kao: Slika 1-2

    gdje je k broj glava (G). U naem prethodnom primjeru: 2 bacanja, moda emo imati

    ishode 0, 1 ili 2 glave (G). Dakle, vjerovatnosti se mogu prikazati kao:

    Za (G,G) imamo: ( ) Za (G,P) imamo: ( )

    i tako dalje.

    Na primjeru 3-puta (bacanje novia), moda emo imati 0, 1, 2 ili 3 glave. Dakle,

    vjerovatnost se moe prikazati kao: tada, na primjer, za (G, P, G) imamo: ( )

    Uopte (ili u cijelini) navodimo, kada imamo n ponavljanja Bernoullijeva procesa, n

    dimenzioni uzorak generira 2n uzorak prostor. Za svaku taku uzorkovanja mogui je slijed

    (niz ishoda) U i N s vjerovatnostima koje su povezane s ovim primjerom taki, prikazane su

    algebarski slijedeom relaciom: ; gdje je k broj uspjeha.

    1-2 Binomna raspodjela

    U svakoj taki (Slika 1-3) k je broj uspjeha u n, ako je n ukupn broj Bernoullijevih ishoda,

    gdje je k = 0, 1, 2, ..., n. Razmotrimo sada k kao sluajnu varijablu, koja se ponekad naziva

    binomna varijabla. Tada, na primjer, za n = 2, sluajna varijabla k ima 3 mogua ishoda:

    k = 0, 1, 2. Pitanje je: Koja je vjerovatnost da postoji k uspjeha u n pokusa?

    Reprodukujemo nau geometrijsku

    interpretaciju za n = 2, kao (Slika 1-3). Kao to

    smo ranije vidjeli, vjerovatnosti povezane s

    uzorkom taaka su

    G

    Prema naoj novoj interpretaciji, gdje je k

    sluajna varijabla (binomna varijabla), za take

    (G, G) imamo k = 2, a time i

    G P

    Slika 1-3

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    18

    ( ) ( )

    U takama (G, P), i (P, G), koje su razmak uzorak, lako je ukazati, da za k = 1

    odnosno, razmak uzork mjesta je isti. Dakle, vjerovatnost za k = 1 je

    ( ) ( ) ( ) ( )

    ( ) ( )

    i za (P, P) imamo k = 0 i

    ( ) ( )

    Gledano iz drugog aspekta, moemo protumaiti ove rezultate kako slijedi: Kada je

    n = 2 i k = 1, ukoliko je to mogue, s jednim uspjehom koji je nastao u drugom

    ishodu? Postoje - ( ) (

    )

    Razliiti naini, ili za bilo koji nain, vjerovatnost je:

    i stoga je - ( ) ( )

    Za k = 0 sluaj, pitamo se. Koliko razliitih naina postoji odabira za 0 uspjeha u

    n = 2 bacanja novia? Podsjeajui da je 0! = 1, imamo po definiciji

    ( ) (

    )

    i stoga - ( ) ( )

    Konano, za k = 2, pitamo se. Koliko razliitih naina postoji odabira 2 uspjehe u

    n = 2 bacanja novia? To je prikazano izrazom - ( ) (

    )

    i stoga je - ( ) ( )

    Pimjenimo navedena tumaenje i ako se radi o bacanju novia 3 puta. Sluajna

    varijabla k ima 4 mogua ishoda: k = 0, 1, 2, 3, i

    ( ) ( )

    Na primjer, kada je k = 1, pitamo: Koliko razliitih naina postoje za odabir 1

    uspjeh (u) n = 3 puta bacanje novia? To je prikazano - ( ) (

    )

    i stoga je - ( ) ( )

    Uopte, kada zadajemo n Bernoulli proces s k uspjeha, vjerovatnost k uspjeha je

    ( ) ( ) ( )

    gdje je p vjerovatnost uspjeha i q = 1 - p vjerovatnost neuspjeha.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    19

    P(k) takoer piemo kao - ( ) ''B'' je stav za ''binomial'', a ovaj izraz pokazuje izriito dva parametra n i p.

    ''k'' je sluajna varijabla, a jednaina (1) je raspodjela k koju nazivamo binomna

    raspodjela.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    20

    II Tablice binomne raspodjele

    Tablice binomne raspodjele grupiemo prema svojstvima teorijske distribucije

    diskretne sluajne varijable. A najee teorijske distribucije diskretne sluajne

    varijable su binomna i poissonova distribucija.

    2-1 Vjerovatnosti binomne raspodjele

    Binomna sluajna varijabla je diskretna sluajna varijabla, a definirana je, tada i

    samo tada, kada su ispunjeni uslovi Bernoulijevog eksperimenta:

    a) Postoji n pokuaja ponavljanja eksperimenta, b) Svaki ishod ima dva oekivanja (glava, pismo), c) Vjerovatnosti ishoda su konstantne, i d) Eksperiment je nezavisan.

    (i) Pojedinane vjerovatnosti i vrijednost djeliminog zbira

    Pretpostavimo da imamo kutiju s 3 crvena i 7 crnih kuglica. Odaberimo sluajni

    uzorak veliine 5, izabrane kuglice vraamo. Ovaj uzorak se moe tumaiti kao 5

    ponovljenih Bernoullijevih procesa. Ishod svakog je crvena ili crna kuglica s

    vjerovatnostima p = 0,30 i q = 0,70.

    Neka k (sluajna varijabla) pokazuje broj crvenih kuglica u

    uzorku. Tada je k = 0, 1, ..., 5. Vjerovatnost k = 2 crvenih

    kuglica u n = 5, se ispituje

    ( ) ( | ) ( ) ( ) ( )

    Izraun takvih vjerovatnosti moe postati teak zadatak, sreom, tablice koje su izraunale

    ove vjerovatnosti za odreene vrijednosti su na raspolaganju, one su obino dovoljne da

    pokriju nae potrebe.3 Za uzorke veliine manje od 50 (to jest, manje od 50 ishoda, n 50),

    Tablice Nacionalnalnog ured za standarde e obino biti dovoljne. Za 50 n 100, poznate su tablice binomne raspodjele (esto se koriste u naoj praksi), H. C. Romig.

    4 Ove

    tablice e pokriti veinu praktinih sluajeva, jer kao to emo kasnije vidjeti, kada n

    postaje velik, moemo koristiti normalnu raspodjelu kao aproksimaciju. Tablica 14 su

    dodatak, a objaviljene su 1952. godine, za sada se uvaju u Nacionalnom zavodu za

    standardizaciju SAD.

    -------------------------------------------------------------------- Tablice binomnih vjerovatnosti objavljene su u Dodatku Taro Yamane, Statistics, An Introductory

    Analysis, za n = 1, 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 i p = 0,05; 0,10; 0,15;

    0,20; 0,25; 0,30; 0,35; 0,40; 0,45; 0,50. str. 1100 -1105 - Izvor: Tablice su izvod tablica binomne

    raspodjele vjerovatnosti, Nacionalnog ureda za standarde, primijenjene u matematikim serijama -

    6, US Department of Commerce 1952.

    3 - Tables of the Binomial Probability Distribution, National Bureau of Standards, Applied

    Mathematics Series 6, U. S. Dept. of Commerce 1950.

    4 - H. C. Romig, 50-100 Binomial Tables, New York: John Wiley and Sons, 1953.

    Urna

    3 crvene

    7 crnih

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    21

    Koritenjem tablica Nacionalnog ureda za standardizaciju, moemo pronai vrijednosti za

    jednainu (1) za razne k, koje su u tablici 2-1. Slika 2 1 korespondira sa jednainom (4)

    B(k; n, p) = B(n k; n, 1 p).

    Tablica 2-1. n=5; p=0,30

    k

    P(k)

    5

    0,0024300

    4

    0,0283500

    3

    0,1323000

    2

    0,3087000

    1

    0,3601500

    0

    0,1680700

    Slika 2 1

    Vrijednost (djeliminog zbira) za k = 5 u pojedinanoj sekciji tablica, omoguit e

    izraun vrijednosti te sekcije koritenjem djeliminog zbira -

    ( )

    ( | )

    Meutim, pomou djelominog zbira (dio tablice), moemo nai

    ( ) ( )

    U tablicama se navode vrijednosti p izmeu 0,01 p 0,50. Kad p > 0,50, moemo pretvoriti vjerovatnosti (da odgovaraju ekvivalentima formule) od

    p < 0,50, dakle, koristimo iste tablice. Ta pretvorba se iskazuje kao to je u naem

    prethodnom primjeru. U prethodnom primjeru, udio crvenih kuglica p = 0,30.

    Recimo da je udio p = 0,70. (Tada, bi smo u navedenom uzorku imali 7 crveni i

    3 crne kuglice).

    Rjeimo zadataka, za k = 3,

    ( ) ( ) ( ) ( ) ( )

    Meutim, kako vrijedi relacija

    ( ) (

    )

    i, uopte

    ( ) (

    )

    Takoer, imajte na umu da

    ( ) ( ) ( ) ( )

    Uvrtavanjem ovih rezultata u jednainu (2), nalazimo

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    22

    ( ) ( ) ( ) ( ) ( )

    (

    ) ( ) ( ) ( )

    Dakle, pomou p = 0,30 i jednaine (3), moemo nai vjerovatnost jednaine (2).

    Moemo rei da (traimo): Vjerovatnost 3 uspjeha u 5 ishoda, gdje je p = 0,70;

    jednaka vjerovatnosti 5 - 3 = 2 uspjeha u 5 ishoda, dakle p = 1 - 0,70 = 0,30.

    Uopte,

    ( ) ( ) ( )

    (ii) Kumulativne vjerovatnosti

    Pretpostavimo da smo zainteresirani za pronalaenje vjerovatnost odabira barem 3

    crvene kuglice u 5 ishoda. To znai pronalaenje vjerovatnost odabira 3, 4, ili 5

    crvenih kuglica zbrajanjem vjerovatnosti.

    To jest,

    ( | ) ( ) ( ) ( )

    ( ) ( ) ( ) (

    ) ( ) ( ) (

    ) ( ) ( )

    ( ) ( ) ( )

    i uopte, imamo

    ( | ) ( )

    Oba izvora imaju kumulativne tablice vjerovatnosti. Tablice Nacionalnog zavoda

    za standarde su ''vie nego'' osnova, a Romig tablice su ''manje od'' osnovnih.

    Budui da je p = 0,30 i n = 5 u naem primjeru, moemo koristiti tablice

    Nacionalnog zavoda za norme.

    ( | )

    Kada je p > 0,50 vrimo transformaciju slinu dogaajima pojedinanih

    vjerovatnosti s odgovarajuom ekvivalentnom formulom gdje je p < 0,50.

    Iustrirajmo primjer doputajui da je p = 0,70 i pronaimo vjerovatnost najmanje 3

    uspjeha za n = 5. To pokazujemo kao slijedei izraz:

    ( | ) ( ) ( ) ( ) ( ) ( ) ( )

    ( ) (

    ) (

    )

    Podsjeajui da je ( ) (

    ) postoji

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    23

    ( | ) ( ) (

    ) (

    )

    ( ) ( | )

    Ima razloga za tvrdnju da je zaobilazni postupak razvijen jednainom

    (1): 1- p = 1 0,70 = 0,30 < 0,50 i (2) tablice Dravnog zavod za norme su ''vie

    nego'' kumulativne tablice

    ( | )

    Uopte, moemo rei da je

    ( | ) ( || )

    gdje je q = 1- p.

    Primjer 1

    Koja je vjerovatnost odabira najmanje 2 crvene kuglice, ako je n = 5, p = 0,7?

    ) ( | ) ( ) ( ) ( ) ( )

    ( )

    ( ) (

    ) (

    ) (

    )

    ( | ) ( | )

    ) ( | ) ( | )

    ( ) *(

    ) (

    ) +

    [ ]

    Interpretacija:

    Vjerovatnost odabira barem 2 crvene kuglice u 5 ispitivanja, gdje je p = 0,70

    jednak je vjerovatnosti odabira barem 4 crne kuglice minus 1 u 5 ispitivanja, tada

    je q = 0,30 a vjerovatnost je 0,9692200.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    24

    Primjer 2

    Pretpostavimo da je p = 0,40 to je 40 posto, veliki broj porodica u odreenoj

    dravi koristi sapun A. Uzmimo uzorak veliine n = 30. Kolika je vjerovatnost da

    15 porodica koristiti sapun A?

    Budui da pretpostavljamo veliki broj porodica (populacija), pretpostavit emo da

    se p ne mijenja, ak i ako se uzorak promijeni.Vjerovatnost emo iskazati, koristei

    binomne tablice,

    ( | )

    Po definiciji:

    ( | ) ( ) (

    )

    Postoji 8 ansi da u 100 odabira uzorka 30 porodica, 15 porodica koristi

    sapun A.

    Primjer 3

    Koristei podatke iz primjera 2, nai vjerovatnost da postoji barem 15 porodica

    koje koriste sapun A za uzork n = 30. Koristei tablice Dravnog zavoda za

    standarde,

    ( | )

    Po definiciji:

    ( | ) ( ) ( ) ( )

    (

    )

    (

    ) (

    ) (

    )

    [ ]

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    25

    Primjer 4

    U primjeru 3, p = 0,6 - pronai vjerovatnost barem 15 porodica koje koriste sapun

    A.

    ( | ) ( ) ( ) ( )

    ( | ) (

    )

    *(

    ) (

    ) (

    ) +

    [ ]

    III Uzorci raspodjele s udjelima vjerovatnosti

    Uzorci raspodjele u kojima je izbor uzorka sluajan, uz poznatu vjerovatnost

    izbora ''uzorka u populaciji'' (''probability'' uzorci) ini odabrana metoda sluajnog

    uzorka. Vjerovatnost izbora uzorka p prethodno je poznata. Tada moemo

    primjeniti zakon vjerovatnosti binomne raspodjele, a oblik teorijske distribucije

    identificiramo pokazateljima (oekivanja i varijance binomne raspodjele). Drugi

    pristup uzorkovanja su (''nonprobability'' uzorci) kojima istraiva dobro pozna

    svojstva (atribute) populacije, ali tada izborom ''nonprobability'' uzorka se nemogu

    koristiti (pretpostavimo) poznate vjerovatnosti.

    3-1 Uzorak raspodjele s primjerima udjela p

    Mnogi praktini problemi su konkretizacija uzorka p koji moe imati odreena

    svojstva. Iz primjera istraivanja trita istraivai mogu biti zainteresirani za udio

    porodice koja koristi odreene brend kafe, ili kupac koji moe biti zainteresiran za

    udio poremeaja narudbi. Stanovnitvo (populacija) koje se svrsta u dvije klase

    moe se nazvati dvojako, ili binomna raspodjela.

    Neka sektor jednog razreda bude (recimo - mukarac, ili neispravan) i sektor drugog razreda (recimo - ena, ili ne deformisan). Zatim slijedi

    gdje je N ukupan broj populacije. Udio populacije, recimo - mukarci se definiraju

    kao

    Moemo biti zainteresirani za procjenu, ili testiranja hipoteze za dato , ili

    uporevati dva . Za navedene procijene ili testiranje hipoteze, obino odabiremo

    uzorak (traimo uzorak p za procjenu ili ispitivanje hipoteze o ).

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    26

    Za procjenu ili ispitivanja , pomou odabranog udjela p, moramo poznavati

    raspodjelu uzorka. U naoj prethodnoj raspravi, pretpostavili smo veliinu uzorka

    n, a koja nije dovoljno velika da bi koristili normalnu aproksimaciju. Ipak, kada n

    nije veliki u modelima za raspodjelu uzorka, jasno se potvruje da raspodjela

    uzorka p ima iste karakteristike kao i binomna raspodjela.

    Moemo pokazati odnos raspodjele uzorka p i binomne raspodjele izravno. No,

    najprije emo napraviti digresiju i raspravljati o razliitim alternativama (naina

    eksperimenta) Bernoullijevih procesa, a zatim izvesti raspodjelu uzorka. Razlog za

    razgovor o tim razliitim alternativama su razliite osnove Bernoullijeva procesa,

    odnosno izvjesne potvrde da je svaki koristan u odreenim situacijama, odnosno,

    da slobodno koristimo ove razliite pristupe (kad god je to potrebno).

    Uoptavanjem Bernoullijevog procesa neminovno nas vodi diferenciranim

    pristupima eksperimenta, to su svojstva uzorka p i ciljevi istraivanja u ovom

    procesu: sluajne varijable k, diskretnih varijabli X, i raspodjela.

    (i) Tri tumaenja n niza Bernoullijeva procesa

    Pretpostavimo da bacamo kovanicu 10 puta sa sljedeim ishodima:

    Tablica 3-1

    Bernoullijev proces

    ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

    G G P G P P P G G G

    Uz pretpostavku fer bacanja novia, ako dodijelilimo vjerovatnosti ishoda glava

    , tada je ishod pisma

    Neka je X sluajna varijabla dodijeljena bacanjem novia, gdje je

    {

    Zatim slijedi 10 bacanja novia, tada ishode bacanja novia moemo prikazati

    kao

    Tablica 3-2

    Binomna raspodjela

    ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) G G P G P P P G G G

    1 1 0 1 0 0 0 1 1 1

    Zbir (suma) od je

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    27

    Koliki je zbir glava od deset (10) bacanja, te u pogledu naeg prethodnog zapisa,

    moemo pisati

    gdje je k binomna varijabla. S toliko izneenim razlozima e nam se razlikovati

    sljedei pristupi.

    1. Prvi pristup (razmilja o 10 bacanja novia) kao Bernoullijev proces sa 10 neovisnih ishoda sluajne varijable k za ukupan broj uspjeha u 10 opita.

    Raspodjela vjerovatnosti je

    ( ) ( ) ( ) ( )

    gdje je k = 0,1, , 10.

    2. Drugi pristup razmilja o diskretnoj varijabli X, a definira se kao

    ( ) ( ) {

    Tada e 10 bacanja generirati niz od 10 nezavisnih sluajnih varijabli:

    Iz navedene diskretne raspodjele moemo nai oekivanu vrijednost i varijancu

    diskretne varijable X kako slijedi:

    ( ) ( ) ( )

    ( ) ( ) ( )

    ( ) ( )( )

    ( )[ ( ) ( )] ( )

    Koritenjem ovih rezultata, nai emo srednju vrijednost i varijancu sluajne

    varijable k prvim pristupom. Ako nam je poznato da

    ( )

    Dakle, koristei rezultate (3) i (4), oekivana vrijednost varijance za k su,

    ostavljajui n = 10,

    ( ) ( )

    ( ) ( ) ( ) ( ) ( ) ( )

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    28

    3. Prvi pristup k smatra sluajnom varijablom. Drugi pristup smatra niz

    nezavisnih sluajnih varijabli i redefinirani k diskretnom varijablom Trei pristup, o kojem emo razgovarati, smatra raspodjelom.

    Objanjavajui ovaj trei pristup, najprije emo pretpostaviti populaciju i uzorak.

    Neka populacija ima 10 vrijednosti

    gdje sada raspodjelu definiramo kao

    {

    Dakle, funkcija gustoe X je

    ( ) ( )

    gdje je K agregat populacije

    Zatim, budui da je X = 0 ili 1, K je ukupn (ili agregat) populacije. U naem

    sadanjem primjer, imamo K = 6, dok smo prije imali 6 ishoda (glava).

    Srednja vrijednost populacije je

    ( )

    i jednak je omjeru populacije. emo smatrati posebnim sluajem . Sada emo uzeti sluajni uzorak veliine n = 4 iz populacije i pretpostaviti da je to

    Tablica 3-3

    Poseban sluaj za uzorka n = 4 G G P G

    1 1 0 1

    Tada ukupan (agregat) i prosjena vrijednost uzorka su

    ( )

    Dakle, prosjena vrijednost uzoraka je srazmjerna populaciji.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    29

    Varijanca uzorka je

    ( )

    ( )

    *

    +

    No, imamo

    i zamjenom u jednaini gore, nalazimo

    ( )

    Prethodno smo vidjeli da je nepristrasna procjena varijance populacije

    ( ) ( )

    Uvrtavanjem (11) u (12), nailazimo

    ( )

    kao nepristrasne procjene

    (ii) Varijanca uzoraka

    Ilustrirajmo ove rezultate s naim primjerom.

    Tablica 3-4

    Varijanca uzoraka n = 4

    x

    ( )

    1

    1/4

    1/16

    1

    1/4

    1/16

    0

    - 3/4

    9/16

    1

    1/4

    1/16

    3

    0

    12/6

    ( )

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    30

    Udio uzorka je

    Iz (11), nailazimo varijancu kao

    (

    ) (

    )

    dakle, to je isti rezultat kao da je izvoden koritenjem tablice.

    (iii) Raspodjela uzorka p u prostoru

    Neka nam sljedei primjer omogui raspodjelu uzorka p. Uzeli smo uzorak

    veliine n = 4, a budui da sluajna varijabla x ima samo 2 ishoda (koji su

    vjerovatnosti i 1- ), imamo 4- dimenzioni uzorak, u prostoru sa uzorak taaka. Nabrojmo tih 16 uzorak taaka (tablica 3-5).

    Tablica 3-5

    Funkcija raspodjele uzorka p u prostoru

    ( )

    1 1 1 1

    ( )

    0 1 0 1

    ( )

    1 1 1 0

    ( )

    0 0 1 1

    ( )

    1 1 0 1

    ( )

    0 1 1 0

    ( )

    1 0 1 1

    ( )

    1 0 0 0

    ( )

    0 1 1 1

    ( )

    0 1 0 0

    ( )

    1 1 0 0

    ( )

    0 0 1 0

    ( )

    1 0 1 0

    ( )

    0 0 0 1

    ( )

    1 0 0 1

    ( )

    0 0 0 0

    Budui da vjerovatnost za 1 jeste i vjerovatnost za 0 jeste 1- , funkcija gustoe

    povezana sa svakom od tih taaka prikazan je kao funkcija raspodjele

    ( ) ( )

    za 4- dimenzioni uzork, n = 4, uzorak taka (1) u prethodnoj tablici je funkcija

    gustoe za varijablu n = 4

    ( ) ( )

    i tako dalje.

    Iako imamo 16 razliitih uzorak taaka (to i jesu apsulutno mogui ishodi

    raspodjele), na primjer, uzorak take (1, 1, 1, 0), (1, 1, 0, 1), (1,0,1,1) i (0,1,1,1) su

    uzorak take istog uzorka p sa istim frekvencijama varijable k. Neka sada

    pregrupirama uzork u smislu diskretne varijable X: X = 1, i pokazateljima

    frekvencije varijable koju smo oznaili s k.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    31

    Tablica 3-6

    Uzorak take i frekvencije

    k

    Uzorak take

    f

    4

    (1)

    1

    3

    (2), (3), (4), (5)

    4

    2

    (6), (7), (8), (9), (10), (11)

    6

    1

    (12), (13), (14), (15)

    4

    0

    (16)

    1

    Broj uzorak toaka koje odgovaraju k mogu se nai pomou formule

    ( )

    Na primjer, za k = 2,

    ( ) (

    )

    to pokazuje da postoji 6 naina naruivanja (neke robe sa svojstvima krajnje

    potronje) po dvije narudbe u 4 mjesta.

    Raspodjela vjerovatnosti k je ova

    ( ) ( ) ( )

    to je binomna raspodjela vjerovatnosti.

    Budui da udio uzorka p jeste

    moemo zamijeniti k s p u tablici: dakle, kako

    se vidi raspodjela vjerovatnost p je ista kao i k.

    To se moe napisati kao

    (

    ) (

    ) ( )

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    32

    To je raspodjela uzorka p, odnosno binomna raspodjela vjerovatnosti. Rezultati za

    na primjer navedeni su u tablici 3-5, grafiki na Slici 3-1 za

    .

    6/16

    5/16

    1/16

    Slika 3-1

    Tablica 3-7

    Uzorak take i frekvencije odabranog niz B(k; n = 4, 0< p

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    33

    (iv) Srednja vrijednost i varijanca uzorka p

    Iz jednaine (1), (6) i (7), slijedi da binomna varijabla k ima binomnu raspodjelu

    ( ) ( ) ( )

    sa oekivanjem ( ) i varijancom ( )

    ( ) ( )

    ( ) ( ) ( )

    Ve smo konstatovali da je udio uzorka

    Dakle, iz jednaine (15) i (16),

    nailazimo

    ( ) (

    ) ( )

    ( ) (

    ) ( )

    ( )

    ( )

    Dakle, to je srednja vrijednost i varijance uzorka p.

    Primjer 1

    Pretpostavimo da imamo veliku populaciju puaa i nepuaa i neka udio

    populacije puaa bude = 0,4 a nepuaa 1 - = 0,6. Uzmimo uzorak od

    n = 10. Tada broj puaa k (koji je sluajna varijabla) moe poprimiti vrijednosti

    k = 0, 1, 2, ..., 10. Sluajna varijabla k moe se izraziti po udjelu uzorka p kao

    Vjerovatnosti navedenih primjerima (omjeri za

    )

    nalazimo u tablicama Nacionalni ured za standarde, kao to je prikazano

    tablicom 3-6.

    Tablica 3-8

    Primjenjeni omjeri za p tablicu Nacionalnog ureda za standarde

    P(p = 0/10) = 0,0060

    P(p = 6/10) = 0,1115000

    P(p = 1/10) = 0,0403

    P(p = 7/10) = 0,0425000

    P(p = 2/10) = 0,1209

    P(p = 8/10) = 0,0106000

    P(p = 3/10) = 0,2150

    P(p = 9/10) = 0,0015720

    P(p = 4/10) = 0,2508

    P(p = 10/10) = 0,0001049

    P(p = 5/10) = 0,2006

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    34

    Slika 3-2 je grafiki prikaz binomne raspodjele P(p = 4/10) = 0,2508, za navedeni primjer,

    znai da ako smo uzeli uzorak veliine 10, vjerovatnost da je k = 4 puaa (p = 4/10 = 0,4)

    je 0,2508. Ili da to postavimo na drugi nain, ako smo odabrali 100 uzoraka odabrane

    populacije veliine 10, moemo oekivati da oko 25 posto tog uzoraka e imati k = 4

    puaa. Visina grafikona pokazuje relativnu frekvenciju s kojom moemo oekivati uzork s

    k puaa.

    0,25

    0,10

    0,05

    n = 10,

    Slika 3-2

    Srednja vrijednost i varijanca raspodjele su

    ( )

    ( ) ( )

    ( )

    Budui da je E(p) = 0,40 je u intervalu (0 < 0,50) - vidimo da je grafikon raspodjele

    pomjeren udesno. Za > 0,50 grafikon raspodjele je pomjeren u lijevo, a za = 0,50

    grafikon raspodjele je simetrin.

    Primjer 2

    Pretpostavimo da za = 0,25 (Slika 3-3), porodica koristi sapun A.

    0,10

    0,05

    0 1 2 3 4 5 6 7 8 9 10 k

    Slika 3-3

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    35

    Uzork od n = 10 i neka je p udio porodica koje koriste sapun A u uzorku. Tada je

    raspodjela vjerovatnosti za uzorak p

    ( ) ( )

    ( )

    gdje je k = 0, 1, ..., 10. Iz binomne tablice: B(k; n = 10, = 0,25), nalazimo

    vjerovatnost ( ) ( ) koja je iskazano u tablici 3-7.

    Tablica 3-9

    Binomna tablica: B(k; n = 10, = 0,25)

    k

    P(k)

    0

    0,00

    0,05600 1

    0,10

    0,18800

    2

    0,20

    0,28200

    3

    0,30

    0,25000 4

    0,40

    0,14600

    5

    0,50

    0,05800

    6

    0,60

    0,01600 7

    0,70

    0,00300

    8

    0,80

    0,00040

    9

    0,90

    0,00003 10

    1,00

    0,00000

    Srednja vrijednost i varijanca uzorka p je

    ( )

    ( ) ( )( )

    IV Hipoteze i testovi

    Razumno je prije postavljene hipoteze i testiranja populacije odrediti traene

    parametre uzorka p koristei statistiku analizu. Razloge ovakoj obradi prikupljenih

    informacija traimo u brojnosti polaznog skupa (populaciji), u tom sluaju mogue

    je da koristimo teoriju uzoraka ili teoriju reprezentativnih metoda, kojom emo

    ustanoviti:

    (1) Svojstva populacije na temelju svojstava uzorka, i

    (2) (Greke), koliko dobiveni rezultati odstupaju od tanih vrijednosti populacije.

    4-1 Testovi binomne raspodjele

    U ovom podnaslovu ispitujemo testove hipoteza o proporciji, koristei binomnu

    raspodjelu proporcija uzorka p (koje su prethodno izvedene). S razlogom su

    ukljueni i testovi koji razlikuju testove odbacivanja regije. Prvo emo dati

    primjere test hipoteze, a zatim objasniti (protumaiti) Clopper - Pearson ljestvice.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    36

    (i) Ispitivanje hipoteze

    Pretpostavimo da e Companija odbiti poiljku odreenog proizvoda, ako ih je vie

    od 25 posto u kvaru, i da e prihvatiti poiljku ako ih je manji ili jednak 25 posto

    neispravno. Companija je odgovorna (zabrinuta da bi izbjegli pogreku

    odbacivanja poiljke kada ne bi trebali). Tada null i alternativne hipoteze

    postavljamo, kao slijedei primjer:

    Takoer pretpostavimo da je n = 10, dok je razina znaajnosti = 10 posto.

    Problem (hipotezu) emo predstaviti shematski kao to slijedi:

    Odluka

    ( | )

    ( | )

    Vjerovatnost za eljeno p* - utvrena je u Binomnoj tablici: B(k; n = 10, = 0,25).

    To je reprodukcije s dodatnim kumulativnim i dekumulativnim stupcima. Imajmo

    na umu da za vjerovatnosti p, poznate su i tablice: B(k; n = 10, = 0,25).

    Tablica 4-1

    Binomna tablica: B(k; n = 10, = 0,25)

    k

    p = k/n

    P(k)

    Kumulativ

    Decumulativ

    0

    0,00

    0,05600

    0,05600

    0,99943

    1

    0,10

    0,18800

    0,24400

    0,94343

    2

    0,20

    0,28200

    0,52600

    0,75543

    3

    0,30

    0,25000

    0,77600

    0,47343

    4

    0,40

    0,14600

    0,92200

    0,22343

    5

    0,50

    0,05800

    0,98000

    0,07743

    6

    0,60

    0,01600

    0,99600

    0,01943

    7

    0,70

    0,00300

    0,99900

    0,00343

    8

    0,80

    0,00040

    0,99940

    0,00043

    9

    0,90

    0,00003

    0,99943

    0,00003

    10

    1,00

    0,00000

    0,99943

    0,00000

    0,99943

    ( ) ( )

    ( ) ( ) ( ) ( )

    Hipoteza pokazuje da je kritina vrijednost p* ustvari raspodjela uzorka p. Dakle,

    koristimo kumulativni stupac tablice 3-8 odreen sa p*. Kao to to pokazuje

    kumulativni stupac,

    ( )

    ( )

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    37

    Neka p = 0,50 zadovoljava uvjet = 0,10 dok p = 0,40 ne zadovoljava. Budui da

    je p diskretna varijabla, ne moemo odabrati vrijednosti izmeu 0,40 i 0,50. Dakle,

    kritina vrijednost p* je 0,50.

    Zakljuak (pravilo postavljene hipoteze) je: uzeti uzorak p veliine n = 10. Ako

    Varijable k i p, kao i binomnu raspodjelu B(k; n = 10, = 0,50) ilustriramo

    Slikom 4-1 u pravokutnom koordinatnom sistemu, gdje je x osa: (k/n) za

    k = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.

    Slika 4-1

    (ii) Clopper - Pearson

    Raspodjela uzorka p je ustvari binomna raspodjela varijable P(p), kao to slijedi:

    ( ) ( )

    ( )

    Kao to to prikazuje jednaina, P(p) ovisi o n, p, i . U naim prethodnim

    primjerima testiranja hipoteza, odrat emo n i fiksnim i neka p diferenciramo.

    Ono to elimo uiniti sada (prva solucija) n je fiksno, i neka i p variraju, a

    zatim emo pokazati kako odbaciti interval pouzdanosti. Ponimo nau raspravu s

    jednostavnim ilustracijama.

    Prvo emo pripremiti (Tablicu), gdje su p i promjenjive varijable, drei veliinu

    uzorka n = 10 konstantnom. Vidimo da se vrijednosti iz tablice 3-9, za vrijednosti

    = 0,40 odgovara nizu n za = 0,40.

    Rezultati tablice 3-9, gdje smo pretpostavili uzorak = 0,25 (porodice koriste

    sapun), nalaze se u nizu odgovara = 0,25 tablici 3-9. A sada emo raspravljati o

    nekim primjerima i pokazati kako se ova tablica moe koristiti.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    38

    - Koritenje Clopper - Pearson ljestvica

    Primjer 1

    Tvrtka prima poiljke (inputi proizvodnje) dijelovi za proizvodnju televizora. Ako ih je 20

    posto ili manje neispravnih, tvrtka e prihvatiti poiljku (ulaz dijelova na skladite za

    proizvodnju). Ako ih je vie od 20 posto neispravnih - poiljka e biti odbijen.Tvrtka je

    zabrinuta za eventualne greke (kako izbji greke odbacivanja poiljke):

    Odluka

    ( | )

    ( | )

    postavljen je rizik = 10 posto, a veliina uzorka n = 10. Nulta i alternativna hipoteze su

    Tabelica 4-2

    Clopper Pearson ljestvice

    /p 0,05 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00

    0,95

    0,001 0,010 0,075 0,315 0,599

    0,90

    0,002 0,011 0,057 0,194 0,387 0,349

    0,85

    0,001 0,008 0,040 0,130 0,276 0,347 0,197

    0,80

    0,001 0,006 0,026 0,088 0,201 0,302 0,268 0,107

    0,75

    0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056

    0,70

    0,001 0,009 0,037 0,103 0,200 0,267 0,233 0,121 0,028

    0,65

    0,001 0,004 0,021 0,069 0,154 0,238 0,252 0,176 0,072 0,013

    0,60

    0,002 0,011 0,042 0,111 0,201 0,251 0,215 0,121 0,040 0,006

    0,55

    0,004 0,023 0,075 0,160 0,234 0,238 0,166 0,076 0,021 0,003

    0,50 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001

    0,45 0,003 0,021 0,076 0,166 0,238 0,234 0,160 0,075 0,023 0,004

    0,40 0,006 0,040 0,121 0,215 0,251 0,201 0,111 0,042 0,011 0,002

    0,35 0,013 0,072 0,176 0,252 0,238 0,154 0,069 0,021 0,004 0,001

    0,30 0,028 0,121 0,233 0,267 0,200 0,103 0,037 0,009 0,001

    0,25 0,056 0,188 0,282 0,250 0,146 0,058 0,016 0,003

    0,20 0,107 0,268 0,302 0,201 0,088 0,026 0,006 0,001

    0,15 0,197 0,374 0,276 0,130 0,040 0,008 0,001

    0,10 0,349 0,387 0,194 0,057 0,011 0,002

    0,05 0,599 0,315 0,075 0,010 0,001

    Izvor:Taro Yamane, Aoyama Gakuin University, Tokyo; STATISTIKA, Uvodna analiza;

    19. - Binomna raspodjela - 19.6. Testovi hipoteza, (koristei binomnu raspodjelu), str. 699

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    39

    Slika 4-2

    Grafikoni (slika 4-2), u rasponu vrijednosti glatkih funkcija P(p) zorno

    predstavlja raspodjelu varijablih P(p) za sve vrijednosti uzorka p, odnosno

    Ovim testom trebamo pronai raspodjelu uzorka p kojoj odgovara tablica

    = 20 posto. Pokaimo ove vjerovatnosti grafiki, kao to je na Slici 4-3, grafikon

    koristimo kao vizualnu pomo (ali sada diskretne varijable k i raspodjele P(k)).

    P(k)

    0,2

    0,1

    0 1 2 3 4 5 6 7 8 9 10 k

    Slika 4-3

    Prema naem testu, elimo nai kritinu vrijednost p* za koje imamo 10 posto

    podruja (vjerovatnosti). (Prethodne tablice) ukazuju da vjeroatnost izvan p = 0,50

    je

    ( )

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    40

    Vjerovatnost izvan p = 0,40 je

    0,088 + 0,033 = 0,121 (12,10%)

    Tumaenjem tih vjerovatnosti slijedi: Kada je udio stanovnika = 0,20 -

    vjerovatnost odabira uzoraka veliine n = 10 za p 0,50 je 3,30 posto.Vjerovatnost odabira uzoraka s p 0,40 iznosi 12,10 posto.

    Dakle, ako je = 10 odsto strogo potovan, i kritina vrijednost p* = 0,50

    ( - rizik je 3,30 posto), znatno je manja od 10 posto, a to je prema uslovima

    prihvatanja narudbe tvrtka spremna dopustiti.

    Ako tvrtka osjea ovaj prag previe ozbiljanim, potrebno je rizik analizirati u

    drugim granicama - rizika, i neka je rizik povean na 12 posto, umjesto 10 posto.

    Kritina vrijednost e biti p* = 0,40. Koristei ovu drugu kritinu vrijednost,

    odnosno pravilo odluke je: Uzmimo uzorak veliine n = 10.

    ako je

    Tada je - rizik 12 posto. -rizik ne izraunavamo.

    Primjer 2

    - rizik u naem prethodnom primjeru je 10 posto. Razmotrimo sada dva sluaj s 5

    posto na svakom kraju, udio stanovnika je = 0,25. Na donjem (lijevo) kraku,

    vrijednost 0,056 vei je od 5 posto. No, varijabla p je diskretna, a p = 0 je

    najmanja vrijednost koja je mogua: koristiti emo pribline vrijednosti 0,056 a

    koji e zadovoljiti uvjet da je = 5 posto.

    Za gornji kraj, vrijednost raspodjele za p = 0,60 (koji za k = 6) je zaokruen. Kao

    to pokazuje tablica 3-9, vjerovatnost da u gornjem kraju postaje

    0,016 + 0,003 = 0,019

    to je znatno manje od 5 posto. Meutim, vjerovatnost p = 0,50 je 0,058; Dakle,

    odbacujemo regiju koja poinje sa p = 0,50 - rizik postaje

    0,058 + 0,019 = 0,077

    i postaje vei od 0,05 (od 5%). Dakle, dopustiti emo start za p = 0,60.

    Neka je na pogled usmjeren na crveno = 0,30 a zatim obavimo istu operaciju.

    Da bi bio 5 posto ili manji, uoimo vrijednost 0,028 koji odgovara p = 0

    (ili k = 0). Vrijednost koja odgovara p = 0,10 (ili k = 1) je 0,121, to znatno prelazi

    0,05.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    41

    Za vrijednosti 0,037, to odgovara p = 0,60 (ili k = 6), kumulativni zbroj za gornji

    dio kraka je

    Vrijednost koja odgovara p = 0,50 je 0,103 i mnogo je vei od 0,05 a time je

    iskljuena.

    Granine vrijednosti su pocrtane crvenim u tablici 3-9, na slian nain i mjesto tih

    zaokruenih vrijednosti nam daje granicu gornje i donje kritine regije.

    Na slian nain moemo nai granice kada je = 5 posto (odnosno 2,5 posto u

    svakom kraju) ili 2 posto (odnosno 1 posto u svakom kraju) ili neke druge

    vrijednosti. Kada je = 15 posto, na primjer, i manji od 10 posto, granica e biti

    izvan onih vrijednosti to su izvuene za = 10 posto.

    Nadalje, izvuene granice nisu glatke, jer su vrijednosti p i koje smo koristili

    diskretne. No, teoretski, kao i vrijednosti p i (skok malim koracima) se pribliava

    kontinuiranim varijablama, granice e postati glatke krivulje.

    Imajte na umu da ove krivulje pretpostavljaju veliinu uzorka n = 10. U praksi,

    meutim, veliina uzorka e obino varirati ovisno o problemu. Pa neka nam

    sljedei primjer razmotra sluaj gdje je = 5 posto ( je nepromijenj, ali gdje n

    varira). Sada veliina uzorka postaje vea, varijanca raspodjele uzorka p postaje

    manji. To jest,

    ( ) ( )

    varijanca postaje manja, kada n postaje vei. Grafiki (Slika. 4-4), gdje su zorno

    predstavljene raspodjele: a) B(k; n = 10, p = 0,50) i b) B(k; n = 30, p = 0,50),

    kao to vidimo za konstantan p i Dakle, binomna krivulja uz konstantan p s veim n postaje izduena.

    a) ( ) b) ( )

    Slika 4-4

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    42

    To pak implicira sada suenu regiju, to znai kada je uzorak veliki, moemo

    oekivati da e udio uzorka biti blizu udjelu . Tako da granine linije

    (vee od n = 10) e se nai unutar graninih crta za n = 10.

    (iii) Koordinatni sistem uzorka p

    Imajmo na umu da grafikoni dvije binomne raspodjele a) B(k; n =30, p = 0,5) i

    b) B(k; n = 50, p = 0,5) impliciraju prethodna stajalita ali istovremeno varijable

    raspodjele predstavljene su u razmjeri svojstava binomne raspodjele. Tako da

    bitna svojstva binomne raspodjele ini varijabla n.

    ) ( ) ) ( )

    Slika 4-5

    Bitna svojstva binomne raspodjele, zasebnim grafikonom fiksne varijable n

    mogue je predstaviti ako (su binomne varijable konstantne: n i uzorak p), tada i

    samo tada za svako n i fiksni uzorak p mogue je zorno predstaviti: P(p), E(p) i

    rizik.

    - Uzorak p i varijabla n = 50 (konstantna varijabla n)

    a) Uzorak p = 0,30 < 0,50

    Slika 4-6 B(k;n = 50, p = 0,30)

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    43

    b) Uzorak p = 0,50

    c) Uzorak p = 0,70 > 0,50

    b) B(k; n = 50, p = 0,5) c) B(k; n = 50, p = 0,7)

    Slika 4-7

    d) Tri uzorka p (konstantna varijabla n = 50)

    Slika 4-8

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    44

    Ako smo imali grafikon s graninim crtama koje pokazuju odbijanje (regije) za

    odreeni rizik (recimo, = 5 posto) za razliite veliine uzorka, trebali bismo

    moi oitati iz grafikona odbacivanja regije. C.J. Clopper i E.S. Pearson su dobili

    takav grafikon koji je prikazan5 (Taro Yamane, p. 702),a to su granine linije za

    odbijanje regija rizika = 5 posto i n = 10, 15, 20, 30, 50, 100, 250, i 1000.

    Primjer 3

    Razmislimo o uzorku stanovnika gdje 100 posto obitelji koristi sapun A.

    Provjerimo je li ili nije 100 = 30 posto, dakle, hipoteza je

    Sluajnim uzorakom od 100 obitelji uzimamo uzorak i udio obitelji koje koriste

    sapun A, te se utvrdi da je p = 0,38. Da li ovaj rezultat podrava hipotezu da je =

    0,30?

    Sada inimo korak koji odgovara rezultatu = 0,30. Zatim gledamo na dvije

    krivulje kojima odgovara n = 100, nalazimo donje i gornje vrijednosti, 0,20 i

    0,40.Tumaenje je kako slijedi: Ako je u stvari = 0,30 vjerojatnost p pada izvan

    granica 0,20 i 0,40 za = 5 posto. Pod pretpostavkom da je nivo znaajnosti 5

    posto, jer je p = 0,38, prihvaamo nultu hipotezu.6

    --------------------------------------------------

    Ovim komentarom pojanjavamo izvor grafikona s graninim crtama koje pokazuju uslove

    za odbijanje (regije) odreenog rizika () razliitih veliina uzorka p, recimo za uzorak p

    = 0,30 i = 0,70 i konstantnu varijablu n = 10 za rizik = 5% potrebno je odbiti (ne

    prihvatit osnovnu hipotezu rizika . Taro Yamane

    5 Taro Yamane, grafikona Clopper Pearson preuzeto uz saglasnost urednika uvaenog

    asopisa: Biometrica, 26, 1934, str. 404 -413.

    6 Navedenim primjerom, autor Yaro Yamane istie u najoptijem smislu kako izabrani

    primjer moe da se koristiti u demostriranju Clooper Pearson grafikona s graninim

    crtama koje pokazuju uslove za odbijanje regije odreenog rizika .

    - Yaro Yamane, Statistics An Intraductory Analysiis, The Binomial Distribution, p. 702.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    45

    V - OC krivulja (Operating Characteristic Curves)

    OC krivulja je ''glatka'' krivulja, ima oblik ''S'' krivulje, istorijski gledano rezultat je

    ispitivanja procesa uzorkovanja (''probability'' raspodjele) u statistikim analizama

    populacije poznatog uzorka p. Uzorkovanje znatno smanjuje trokove statistike

    analize ili (i) smanjuje rezidium parametara kao to su: oekivana vrijednost,

    srednja vrijednos i varijanca.

    Uinak poveane veliine uzorka na OC krivulje

    Slika 5-1

    5-1 Hipoteze i izraun p*

    Prethodno su hipoteze testirane na temelju -rizika, ali nita nije reeno o

    -riziku. U ovom naslovu pokazat emo kako proraunati -rizik, a zatim, pomou

    izrauna rizika, emo pojasniti OC krivulju (odnosno zakrivljenost krivulje).

    Proces razmiljanja je isti kao kada smo uvodno raspravljali o ovim pitanjima. to

    e razlikovati nain na koji se raunaju vjerovatnosti, naime, mi emo koristiti

    binomne tablice za izraun vjerovatnosti, to je prilino zahtjevan proces. Neka se

    isti postupak ilustruje s primjerom.

    Pretpostavimo da imamo populaciju porodica i neka je udio porodica koje koriste

    sapun A. Ako je 20 posto ili manje, uprava eli poveati izdatke (trokove) za

    sve vidove reklama, a ako je vie od 20 posto, uprava e napustiti oglaavanja na

    sadanjem nivou. Uprava oekuje da e na postojeem nivou reklama izbjei

    poveane trokove, odnosno da e potvrditi hipotezu:

    ( | )

    http://www.micquality.com/six_sigma_glossary/oc_curve.htm

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    46

    Hipoteza je prikazana shematski kao to slijedi:

    Odluka

    ( | )

    ( | )

    U smislu da su hipoteze nulta ili alternativna, imamo

    Neka uprava bude spremna dopustiti -rizik od 5 posto.Problem je pronai kritinu

    vrijednost p*, s obzirom na vrijednost n takav da -rizik je zadovoljavajui. Zatim

    emo nai kritine vrijednosti p* koje odgovaraju uzoraku veliine n = 20, 40, 60,

    80 i 100.

    (i) Izraun p*

    S obzirom da je n = 20, p* nalazimo u tablicama Nacionalnog ureda za standarde

    (pojedinane i kumulativne binomne vjerojatnosti).

    Tablica 5-1

    Binomna tablica B(k; n = 20, p = 0,20); kolona: dekumulativ - ( )

    s = k

    p = k/n

    P(s = k)

    P(s k)

    0

    0,000

    0,0115

    1,0000

    1

    0,050

    0,0576

    0,9885

    2

    0,100

    0,1369

    0,9308

    3

    0,150

    0,2054

    0,7939

    4

    0,200

    0,2182

    0,5886

    5

    0,250

    0,1746

    0,3704

    6

    0,300

    0,1091

    0,1958

    7

    0,350

    0,0545

    0,0867

    8

    0,400

    0,0222

    0,0321

    9

    0,450

    0,0074

    0,0100

    10

    0,500

    0,0020

    0,0026

    11

    0,550

    0,0005

    0,0006

    12

    0,600

    0,0001

    0,0001

    13

    0,650

    0,0000

    0,0000

    14

    0,700

    0,0000

    0,0000

    15

    0,750

    0,0000

    0,0000

    16

    0,800

    0,0000

    0,0000

    17

    0,850

    0,0000

    0,0000

    18

    0,900

    0,0000

    0,0000

    19

    0,950

    0,0000

    0,0000

    20

    1,000

    0,0000

    0,0000

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    47

    Slika 5-2

    Kao to to pokazuje tablica, imamo

    ( | ) ( | )

    ( | ) ( | )

    Budui da elimo = 0,05 ili manje, mi emo uzeti k = 8 ili p* = 8/20 = 0,40 kao

    kritinu vrijednost.

    Tablica 5-2

    Binomne tablice: ( | ) ( | )

    n = 20 s = k p = k /n P(k k0| = 0,20) ( ) = P(k k0| = 0,40) ( )

    20 0 0,000 0,0115

    0,0000 0,0000

    20 1 0,050 0,0576

    0,0005 0,0005

    20 2 0,100 0,1369

    0,0031 0,0036

    20 3 0,150 0,2054

    0,0123 0,0159

    20 4 0,200 0,2182

    0,0350 0,0509

    20 5 0,250 0,1746

    0,0746 0,1256

    20 6 0,300 0,1091

    0,1244 0,2500

    20 7 0,350 0,0545 0,0867 0,1659 0,4159

    20 8 0,400 0,0222 0,0321 0,1797 0,5956

    20 9 0,450 0,0074 0,0100 0,1597 0,7553

    20 10 0,500 0,0020 0,0026 0,1171 0,8724

    20 11 0,550 0,0005 0,0006 0,0710

    20 12 0,600 0,0001 0,0001 0,0355

    20 13 0,650 0,0000 0,0000 0,0146

    20 14 0,700 0,0000 0,0000 0,0049

    20 15 0,750 0,0000 0,0000 0,0013

    20 16 0,800 0,0000 0,0000 0,0003

    20 17 0,850 0,0000 0,0000 0,0000

    20 18 0,900 0,0000 0,0000 0,0000

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    48

    Nastavak

    20 19 0,950 0,0000 0,0000 0,0000

    20 20 1,000 0,0000 0,0000 0,0000

    a) B(k;n = 20, p = 0,20) b) B(k;n = 20, p = 0,40)

    Slika 5-3

    Tablica 5-3

    Binomne tablice: ( | ) ( | )

    s = k p = k /n ( | ) ( ) = P(k k0|=0,40) P(s k)

    1 2 3 4 5 6

    0 0,000 0,0001

    0,0000 0,0000

    1 0,025 0,0013

    0,0000 0,0000

    2 0,050 0,0065

    0,0000 0,0000

    3 0,075 0,0205

    0,0000 0,0000

    4 0,100 0,0475

    0,0000 0,0000

    5 0,125 0,0854

    0,0001 0,0001

    6 0,150 0,1246

    0,0005 0,0006

    7 0,175 0,1513

    0,0015 0,0021

    8 0,200 0,1560

    0,0040 0,0061

    9 0,225 0,1386

    0,0095 0,0156

    10 0,250 0,1075

    0,0196 0,0352

    11 0,275 0,0733

    0,0357 0,0709

    12 0,300 0,0443 0,0875 0,0576 0,1285

    13 0,325 0,0238 0,0432 0,0827 0,2112

    14 0,350 0,0115 0,0194 0,1063

    15 0,375 0,0050 0,0079 0,1228

    16 0,400 0,0019 0,0029 0,1279

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    49

    Nastavak

    17 0,425 0,0007 0,0010 0,1204

    18 0,450 0,0002 0,0003 0,1026

    19 0,475 0,0001 0,0001 0,0792

    20 0,500 0,0000 0,0000 0,0554

    21 0,525 0,0000 0,0000 0,0352

    22 0,550 0,0000 0,0000 0,0203

    23 0,575 0,0000 0,0000 0,0106

    24 0,600 0,0000 0,0000 0,0050

    25 0,625 0,0000 0,0000 0,0021

    26 0,650 0,0000 0,0000 0,0008

    27 0,675 0,0000 0,0000 0,0003

    28 0,700 0,0000 0,0000 0,0001

    29 0,725 0,0000 0,0000 0,0000

    30 0,750 0,0000 0,0000 0,0000

    31 0,775 0,0000 0,0000 0,0000

    32 0,800 0,0000 0,0000 0,0000

    33 0,825 0,0000 0,0000 0,0000

    34 0,850 0,0000 0,0000 0,0000

    35 0,875 0,0000 0,0000 0,0000

    36 0,900 0,0000 0,0000 0,0000

    37 0,925 0,0000 0,0000 0,0000

    38 0,950 0,0000 0,0000 0,0000

    39 0,975 0,0000 0,0000 0,0000

    40 1,000 0,0000 0,0000 0,0000

    a) B(k; n = 40, p = 0,20) b) B(k; n = 40, p = 0,4)

    Slika 5-4

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    50

    Na slian nain, moemo pronai kritine vrijednosti p* za razliite n. Rezultati su

    prikazani u Tablici 5-4.

    Tablica 5-4

    Izraun p* za n = 20, 40, 60, 80, 100 uzoraka p = 0,20 i p = 0,40

    n

    k p*

    ( | ) ( | )

    20 7

    0,0867

    8* 0,400

    0,0322

    0,5955

    40 12

    0,0878

    13* 0,325

    0,0432

    0,2111

    60 16

    0,0773

    17* 0,283

    0,0427

    0,0413

    80 21

    0,0660

    22* 0,275

    0,0390

    0,0137

    100 26

    0,0558

    27* 0,270

    0,0342

    0,0046

    Na primjer, ako je n = 60, vidimo da je za

    ako je k = 17 ili p* = 17/60 = 0,283 kao kritina vrijednost.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    51

    (ii) OC krivulja

    Nakon kritine vrijednosti p* = 0,283 lako nalazimo (moda) i -rizik, a time i OC

    krivulju. Pokaimo sada na dijagramu ( rizik i rizik) dvije binomne

    raspodjele kao vizualnu pomo. Slika 5-4. prikazuje binomne raspodjele

    ) ( ) b) ( )

    Slika 5-5

    Na primjer, za alternativnu hipotezu - rizik

    ( | )

    gdje je p* = 0,283, n = 60, te Tada e - rizik odgovarati nivou alternativnih hipoteza, izraunava se na slian nain, a prikazane su u tablici 5-4.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    52

    Tablica 5-5

    Parametri (neke vrijednosti) alternativnih hipoteza

    n = 60, p* = 0.283, ( | )

    0.40

    0.04

    0.96

    0.35

    0.17

    0.83

    0.30

    0.45

    0.55

    0.25

    0.78

    0.22

    0.20

    0.96

    0.04

    0.15

    0.99

    0.01

    0.10

    0.99

    0.01

    Izvor:Taro Yamane, STATISTICS An introductory analysis,

    19.7. Calculation of the OC kurve, p. 705

    Parametar 1- nazivamo ''snaga testa'', iste parametre emo elaborirati u

    narednom periodu. Dakle, svi parametri ''snage testa'' odnose se na alternativne

    hipoteze a pokazatelj su vjerovatnost da e alternativna hipoteza biti tana

    hipotezu. Osnovna pravila (zakon veliki brojeva) vrijedi iza alternativnu hipotezu.

    Dakle, za vee n, parametar 1- je pouzdaniji.

    - Uzorka (zakon velikih brojeva)

    Svaki odabrani uzorak populacije, odnosno serija varijable k korespondira sa

    varijablom

    Dakle, sasvim je jasno, ve iz ranijih razmatranja da e

    preciznost izrauna parametara odabranog uzorka p ovisiti o veliini varijable

    (n) uzorka p.7

    Upravo naredna tabela parametra uzorka kritinih vrijednosti varijable: p* = 8/2, p* = 13/40, p* = 17/60, p* = 22/80, i p* = 27/100 zorno e nam

    predstaviti nezavisnu varijablu u odnosu na zavisne varijable p* = k/n.

    -------------------------------------------------------

    7 Ako, veliina uzorka postaje vea, varijanca raspodjele uzorka p postaje manji. To jest,

    ( ) ( )

    varijanca postaje manja, kada n postaje vei. U narednom tekstu upravo emo analizirati

    vrijednosti parametra uzorka sa kritinim vrijednostima varijable: n = 20, p* =8/20; n = 40, p* = 13/14; n = 60,

    p* = 17/60; n = 80, p* = 22/80; i n = 100, p* = 27/100.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    53

    Tablica 5-6

    Varijabla p* za n = 20, uzoraka 2 = 0,40

    n = 20 s = k p = n/k P( s = k) (5) (6) 1 -

    1 2 3 4 5 6 7 8 20 0 0,00 0,000037 0,000037 1,000000 0,000000 1,000000

    20 1 0,05 0,000487 0,000524 0,999963 0,000037 0,999963

    20 2 0,10 0,003087 0,003612 0,999476 0,000524 0,999476

    20 3 0,15 0,012350 0,015962 0,996389 0,003611 0,996389

    20 4 0,20 0,034991 0,050952 0,984039 0,015961 0,984039

    20 5 0,25 0,074647 0,125599 0,949048 0,050952 0,949048

    20 6 0,30 0,124412 0,250011 0,874401 0,125599 0,874401

    20 7 0,35 0,165882 0,415893 0,749989 0,250011 0,749989

    20 8 0,40 0,179706 0,595599 0,584107 0,415893 0,584107

    20 9 0,45 0,159738 0,755338 0,404401 0,595599 0,404401

    20 10 0,50 0,117142 0,872479 0,244663 0,755337 0,244663

    20 11 0,55 0,070995 0,943474 0,127521 0,872479 0,127521

    20 12 0,60 0,035497 0,978972 0,056526 0,943474 0,056526

    20 13 0,65 0,014563 0,993535 0,021029 0,978971 0,021029

    20 14 0,70 0,004854 0,998389 0,006466 0,993534 0,006466

    20 15 0,75 0,001294 0,999683 0,001612 0,998388 0,001612

    20 16 0,80 0,000270 0,999953 0,000317 0,999683 0,000317

    20 17 0,85 0,000042 0,999995 0,000047 0,999953 0,000047

    20 18 0,90 0,000005 1,000000 0,000005 0,999995 0,000005

    20 19 0,95 0,000000

    0,000000

    20 20 1,00 0,000000

    Kazatelji iz naslova tabele:

    Osnovne pretpostavke binomne raspodjele B(k; n = 20, ) odnosno serije

    su: (varijable k korespondiraju sa varijablom (

    )

    (5) ( | ) (6) ( | ) (7) ( | )

    a) P(s = k/n) b) P(s = k/n), i 1 -

    Slika 5-6

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    54

    OC krivulja binomne raspodjele B(k; n = 20, 2 = 0,40), prikazana na Slici 5-5,

    gdje je ( | ) (

    | )

    a) 1 = 1 P( k k*|n, 2) b) = P(k k*|n, 2)

    Slika 5-7

    Istim postupkom za n = 20, 40, 80 i 100, nalaze se odgovarajue OC krivulje. To

    su OC krivulje koje odgovaraju razliitim veliinama uzorka

    (iii) Upotreba OC krivulje

    Sada kada imamo krivulju OC, prirodno je da se pitamo: Kako moe da se koristi?

    Krivulja OC predstavlja pravilo za donoenje odluka i stoga se moe koristiti za

    dizajn uzorka p. Objasniti ovo s hipotetzom i primjerom. Pretpostavimo da postoji

    OC krivulja kao to je prikazano na Slici 5-6. Sjetitimo se kako horizontalna skala

    pokazuje razliite alternativne hipoteze a vertikalna skala pokazuje vrijednosti (parametar )

    Tablica 5-7

    ( | ) ( | )

    n = 20

    p* = 8/20

    n = 40

    p* = 13/40

    n = 60

    p* = 17/60

    n = 80

    p* = 22/80

    n = 100

    p* = 27/100

    0,10

    0,999

    0,999

    0,999

    0,999

    0,999

    0,15

    0,998

    0,998

    0,997

    0,998

    0,999

    0,20

    0,990

    0,981

    0,957

    0,961

    0,981

    0,25

    0,959

    0,897

    0,775

    0,745

    0,722

    0,30

    0,887

    0,704

    0,451

    0,363

    0,296

    0,35

    0,763

    0,441

    0,172

    0,097

    0,055

    0,40

    0,595

    0,211

    0,041

    0,013

    0,005

    0,45

    0,415

    0,075

    0,006

    0,001

    0,000

    0,50

    0,252

    0,019

    0,001

    0,000

    0,000

    0,55

    0,60

    1,00

    Izvor:Taro Yamane, STATISTICS An introductory analysis,

    19.7. Calculation of the OC kurve, p. 707

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    55

    Slika 5- 8

    Neka nam 1 oznaava nultu hipotezu, koja je takoer prikazan na Slici. 5-8.

    Zatim visina krivulje u pokazuje ( | )

    gdje je, u ovom sluaju, a time u ovom trenutku na horizontalnoj skali imamo

    ( | )

    Tako udaljenost MK je

    ( | ) ( | )

    To jest, MK jednaka je -riziku. Drugim rijeima, toka na horizontalnoj skali (to

    pokazuje 2) gdje 2 postaje jednak nul-hipotezi 1, gornji dio OC krivulje - MK,

    kao to smo to pokazali,

    e biti jednak -riziku. Tako toka K moe biti prikazana simboliki kao

    ( ) Sljedee, neka nam odabir vrijednosti ' pomogne pronai odgovarajuu toku R na

    krivulji OC, i neka bude '. Onda je to toka R, moe biti prikazan simboliki kao

    (', ').

    Posmatrajmo sada obrnuti postupak i pretpostavimo da imamo statistiki test gdje

    je

    i i -rizika su poznati. Tada moemo planirati dvije toke na OC grafu, naime

    (1,1-) i (2, ), kao to je prikazano na Slici 5-9.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    56

    Slika 5-9

    Traiti OC krivulju koja prolazi kroz ove dvije toke, dopustite da su pokazane na

    krivulji n3.

    Ova krivulja pokazuje (kada se uzima uzorak veliine n), vjerojatnost prihvaanja

    nulte hipoteze, zapravo udio stanovnitva 2, bit e . Napominjemo da je u ovom

    sluaju pogreka tolerirana razlika 2 - 1 = e.

    Moemo nastaviti nau raspravu OC krivulje i razmotriti temu kontrole

    uzorkovanja. Meutim, daljnja rasprava zahtijeva poznavanje normalne

    aproksimacije na binomnu distribuciju i Poisson distribuciju. Dakle, razmotrimo

    ove teme prvi put i odgodimo daljnju raspravu o krivulji OC.

    5-2 Procjena i p

    Do sada smo rijeavali probleme, koristei binomnu raspodjelu, a obzirom na

    pretpostavku da je poznat. Meutim, u mnogim praktinim problemima, se ne

    zna; U tom sluaju potrebno je procijeniti . U ovom dijelu emo prvo raspravljati

    o procjeni , a zatim procjeniti razliita odstupanja.

    (i) Procjena

    Spomenuli smo u poglavlju 8. da udio uzorka p je objektivno maksimalna

    vjerojatnost procjene . Dakle, moemo pisati

    i

    ( )

    Dakle, p je objektivan, dosljedan, i dovoljn procjenitelj .

    Primjer. Izabran je sluajni uzorak od 100 trgovaca, a utvreno je da je 20 od njih doivjelo

    neuspjeh u poslovanju u odreenom mjesecu. Dakle, objektivna procjena maksimalne

    vjerojatnosti djela trgovaca koji su doivjela pad u poslovanju

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    57

    (ii) Procjena varijance

    Vidjeli smo da postoji nekoliko naina posmatranja Bernoullijeva procesa.

    Jedanom je uzeti u obzir broj uspjehe k kao sluajne varijable. Druga je bila da

    biste vidjeli Bernoullijeva proces kao niz sluajnih varijabilnog xi, gdje je xi = 1 ili

    0, i neka je k = x1 + x2 + + xN.Trei je pristup razmotriti raspodjelu xi. Mi emo koristiti ovaj trei pristup kako bi razgovarali o raznim odstupanja.

    Pretpostavimo da imamo dvojaku (ili binomna ili dihotomno) stanovnitvo

    x1, x2, , xN, gdje je

    {

    Uzorak x1, x2, , xn veliine n.

    Vidjeli smo da je ukupno stanovnitva

    Na primjer, pretpostavimo stanovnitvo se svrstati u puaa i nepuaa. Neka xi = 1

    biti pua i xi = 0 biti nepua. Zatim K je ukupno (ili ukupni) broj puaa u

    populaciji. Srednja stanovnitva i varijanca su definirani kao

    ( )

    ( ) ( )

    Na primjer, je udio puaa u omjeru puaa u populaciji, 2 je varijanca xi u

    populaciji.

    Na slian nain definira smo, uzorak,

    ( )

    ( )

    Na primjer, k ukupni broj puaa u uzorku; p je udio puaa u uzorku; i s2 je

    varijanca distribucije x u uzorku.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    58

    Za distribucije uzorka p, imamo

    ( )

    ( )

    ( ) ( )

    Od ranije, znamo da je

    Koritenje tih odnosa i rezultate dobivene gore, nai emo

    kao nepristran procjenitelj varijance populacije.

    Koristei ovaj rezultat, nai emo, uz napomenu da je = p,

    (

    )

    kao nepristran procjenitelj varijance p.

    Meutim, u praksi, pojednostavljena formula

    Koristi, za najpraktinije sluajeve, razlikujemo upotrebu n i n - 1, kada je n

    (prebrojiv) mali. Mi emo koristiti ovu pojednostavljenu formulu za

    Primjer 1

    Sluajni uzorak veliine odabranih 100 osoba, utvreno je da 30 osoba nosi

    naoale. Procjena udjela osoba koje nose naoale u populaciji je

    Procjena varijance populacije je

    ( )( )

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    59

    Procjena varijance distribucije uzorka p je

    ( )( )

    Primjer 2

    Razmislite o populaciji od 10 studenata, njih 4 etvorica su puai.

    i varijance populacija je

    ( )( )

    Izraunajmo koristei definiciju

    ( )

    U tablici 19.12 nalazimo

    ( )

    koji je isti kao i gore dobiveni rezultat.

    Neka smo sada uzeti uzorak od 5 studenata, gdje smo pronali 3 od njih da su

    puai. Udio uzorka p = 3/5 = 0,6. Uzorak varijance je

    ( ) ( )( )

    Tablica 5-8

    x

    ( )

    1 1

    1 0,4 = + 0,6

    0,36

    2 1

    1 0,4 = + 0,6

    0,36

    3 1

    1 0,4 = + 0,6

    0,36

    4 1

    1 0,4 = + 0,6

    0,36

    5 0

    0 0,4 = - 0,4

    0,16

    6 0

    0 0,4 = - 0,4

    0,16

    7 0

    0 0,4 = - 0,4

    0,16

    8 0

    0 0,4 = - 0,4

    0,16

    9 0

    0 0,4 = - 0,4

    0,16

    10 0

    0 0,4 = - 0,4

    0,16

    = 0,00 2,40

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    60

    To se takoer moe izraunati kao to je prikazano u tablici 5-9.

    Tablica 5-9 x

    ( )

    1

    1 0,6 = 0,4

    0,16

    1

    1 0,6 = 0,4

    0,16

    1

    1 0,6 = 0,4

    0,16

    0

    0 0,6 = - 0,6

    0,36

    0

    0 0,6 = - 0,6

    0,36

    = 0,00

    1,20

    Iz tablice nalazimo

    ( )

    Nepristrana procjena varijance populacije je

    ( )( )

    Procjena varijance p je

    ( )

    VI - Normalna aproksimacija binomne raspodjele

    Za velike n binomni pouak ( ) ( ) u redovitim procedorama

    smatramo sloenim. Ako je n veliki i tada je binomna raspodjela simetrina. U navedenim primjerima je aproksimacija izvedena koritenjem

    normalne umjesto binomne raspodjele. Istu aproksimaciju i za vjerovatnosti za

    koje vrijedi ako su np i nq dovoljno veliki.

    Tada moemo koristiti empirijska pravila, normalna raspodjela je dobra

    aproksimacija binarne ako je np > 5 i nq > 5.

    Tada koristimo procedure:

    a) Izraunati za binomnu distribuciju. b) Transformirati diskretnu sluajnu varijablu u kontinuiranu. c) Izraunati vjerovatnost koristei normalnu raspodjelu.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    61

    6-1 Normalna distribucija (priblina binomnoj distribuciji)

    Kao to smo razmatrali u naoj prethodnoj raspravi, izrauni binomne

    vjerovatnosti su u mnogim sluajevima vrlo teak zadatak. Sreom, pod odreenim

    uvjetima, binomna raspodjela pribliava se normalnoj distribuciju i Poissonovoj

    distribuciji, koje su lake za izraun. U ovom poglavlju emo objasniti odnos

    izmeu normalne i binomne distribucije pomou jednostavne ilustracije i pokazati

    heuristiki kako binomna raspodjela pristupa normalnoj distribuciji kada n postane

    velik. Poissonovu aproksimaciju binomne distribucije emo objasniti naknadno

    (izborom odgovarajue teme).

    Pretpostavimo da je = 0,40 populacija studenata puaa. Jednostavna veliine

    n = 10 uzima se zamjenom, koja se moe smatrati kao 10 ponovljenih

    Bernoullijevih pokusa. Neka je k broj puaa (to jest, uspjesi) u uzorku. Tada

    binomne vjerovatnosti B(k; n = 10, = 0,40) za k = 0,1, 2, , 10 smo dobili tablicama Nacionalnog ureda za standarde, tablici i histogram tih vjerovatnosti su

    prikazano (Tablice 6-1 i Sl. 6-1).

    Moemo vidjeti (kada heuristiki n postaje vei), irina pravokutnika i koraci u

    histogramu e postati manji,

    Tablice 6-1 k

    p = k/n

    ( )

    0

    0,00

    0,006

    1

    0,10

    0,040

    2

    0,20

    0,121

    3

    0,30

    0,215

    4

    0,40

    0,251

    5

    0,50

    0,201

    6

    0,60

    0,111

    7

    0,70

    0,042

    8

    0,80

    0,011

    9

    0,90

    0,002

    10

    1,00

    0,000

    1,000

    Slika 6-1

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    62

    krivulja e postati glatka krivulja. Nai navodi nisu rigorozni, i (bez dokaza je

    jasno) kada , glatka krivulja e postati normalna krivulja. To jest binomna distribucija e postati normalna distribucija.

    Kada je rije o normalnoj distribuciji, do sada smo koristili standardizirane tabele.

    Standardizirana varijabla je prikazan kao

    Gdje su , i (srednja vrijednost i standardna devijacija raspodjele).

    Za binomnu distribuciju, sluajna varijabla k sa srednjom vrijednou i varijancom

    je

    ( ) ( ) ( )

    Dakle, standardizirana binomna varijabla e biti

    ( )

    Iz navedenog teorema slijedi, ako , tada k moe se smatrati standardom normalne varijable s prosjenom vrijednosti 0 i varijancom 1.

    Prethodno smo raspravljali o korekciji i kontinuitetu, moe se primijeniti na

    sluajne varijable k. Koji (odgovarajui k*), k treba prilagoditi (+1/2) ili (-1/2),

    ovisno o problemu. Dakle, normalizirana varijabla k* treba da je

    (

    )

    ( )

    U mnogim problemima, ova statistika metoda je vie prikladna za koritenje

    udijela uzorka p = k/n umjesto k kao sluajne varijable. Zatim normalizirana

    varijabla postaje

    ( )

    (

    )

    ( )

    vidimo da je

    ( ) ( ) ( )

    Ilustrirajmo koritenje tih formula s primjerima.

  • UVODNA ANALIZA I TEORIJSKE OSNOVE BINOMNE RASPODJELE

    63

    Primjer 1

    Dosadanja istraivanja pokazuju da 40 posto porodica u odreenoj zemlji su

    demokrate. Odabran je sluajni uzorak od 50 porodica. Koja je vjerovatnost da e

    25 ili vie demokratskih obitelji u ovom uzorku?

    a) Binomna raspodjela po k b) Binomna raspodjela po p

    Slika 6-2

    Situacija je shematski prikazano na Sl.6-2 kao vizualna pomo. Oito je da

    moemo koristiti k ili p kao sluajne