40
HEMIJA ŽIVOTNE SREDINE II ___________________________________________________________________________ ANALITIČKE GREŠKE I STATISTIČKA ANALIZA GREŠAKA 1. OSNOVNI POJMOVI 1.1. DEFINICIJA GREŠAKA 1.1.1. Apsolutna greška 1.1.2. Relativna greška 1.1.3. Sistematska greška 1.1.4. Slučajne greške 1.2. NESIGURNOST PRI MERENJU 1.3. PRECIZNOST 1.4. TAČNOST 1.5. PROMAŠENO MERENJE 1.6. SIGURNE CIFRE 2. STATISTIČKA ANALIZA GREŠKE 2.1. TERMINOLOGIJA 2.1.1. Verovatnoća i statistika 2.1.2. Populacija, uzorak, proba i oprobavanje 2.1.3. Odstupanje ili devijacija 2.2. DESKRIPTIVNA STATISTIKA 2.2.1. Setovi merenja i distribucija rezultata 2.2.2. Aritmetička srednja vrednost 2.2.3. Geometrijska srednja vrednost 2.2.4. Medijana 2.2.5. Kvartili 2.2.6. Gausova ili normalna raspodela 2.2.7. Matematička transformacija deformisanih raspodela 2.2.8. Standardna devijacija pojedinačnog merenja 2.2.9. Studentova ili t raspodela 2.2.10. Uticaj broja merenja na standardnu devijaciju pojedinačnog merenja 2.2.11. Standardna devijacija srednje vrednosti 2.2.12. Značajnost merenja 2.2.13. Test normalnosti 2.2.14. Odbacivanje merenja sa velikom greškom 2.2.15. Greške koje nastaju zbog rezultata koji su ispod detekcijonog limita 2.2.16. Jedan konkretan primer 2.2.17. Grafičko prikazivanje rezultata 3. VARIJANSA 3.1. ANALIZA VARIJANSE 3.1.1. Jednosmerna analiza varijanse za nezavisne vrednosti 4. NESIMETRIČNE ILI DEFORMISANE RASPODELE 4.1. RAZLIKA IZMEĐU MEDIJANE I SREDNJE VREDNOSTI ODNOSNO KVARTILA I DEVIJACIJE 5. KORELACIJA 5.1. KOEFICIJENT KORELACIJE 5.2. TUMAČENJE LINEARNOG KEFICIJENTA KORELACIJE 5.2.1. Primer za linearnu korelaciju 6. PROPAGACIJA GREŠKE 6.1. IZRAČUNAVANJE KUMULATIVNE GREŠKE Ivan Gržetić, HF 1

HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

  • Upload
    others

  • View
    94

  • Download
    9

Embed Size (px)

Citation preview

Page 1: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

ANALITIČKE GREŠKE I STATISTIČKA ANALIZA GREŠAKA 1. OSNOVNI POJMOVI

1.1. DEFINICIJA GREŠAKA 1.1.1. Apsolutna greška 1.1.2. Relativna greška 1.1.3. Sistematska greška 1.1.4. Slučajne greške

1.2. NESIGURNOST PRI MERENJU 1.3. PRECIZNOST 1.4. TAČNOST 1.5. PROMAŠENO MERENJE 1.6. SIGURNE CIFRE

2. STATISTIČKA ANALIZA GREŠKE 2.1. TERMINOLOGIJA

2.1.1. Verovatnoća i statistika 2.1.2. Populacija, uzorak, proba i oprobavanje 2.1.3. Odstupanje ili devijacija

2.2. DESKRIPTIVNA STATISTIKA 2.2.1. Setovi merenja i distribucija rezultata 2.2.2. Aritmetička srednja vrednost 2.2.3. Geometrijska srednja vrednost 2.2.4. Medijana 2.2.5. Kvartili 2.2.6. Gausova ili normalna raspodela 2.2.7. Matematička transformacija deformisanih raspodela 2.2.8. Standardna devijacija pojedinačnog merenja 2.2.9. Studentova ili t raspodela 2.2.10. Uticaj broja merenja na standardnu devijaciju pojedinačnog merenja 2.2.11. Standardna devijacija srednje vrednosti 2.2.12. Značajnost merenja 2.2.13. Test normalnosti 2.2.14. Odbacivanje merenja sa velikom greškom 2.2.15. Greške koje nastaju zbog rezultata koji su ispod detekcijonog limita 2.2.16. Jedan konkretan primer 2.2.17. Grafičko prikazivanje rezultata

3. VARIJANSA 3.1. ANALIZA VARIJANSE

3.1.1. Jednosmerna analiza varijanse za nezavisne vrednosti 4. NESIMETRIČNE ILI DEFORMISANE RASPODELE

4.1. RAZLIKA IZMEĐU MEDIJANE I SREDNJE VREDNOSTI ODNOSNO KVARTILA I DEVIJACIJE 5. KORELACIJA

5.1. KOEFICIJENT KORELACIJE 5.2. TUMAČENJE LINEARNOG KEFICIJENTA KORELACIJE

5.2.1. Primer za linearnu korelaciju 6. PROPAGACIJA GREŠKE

6.1. IZRAČUNAVANJE KUMULATIVNE GREŠKE

Ivan Gržetić, HF 1

Page 2: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

1. OSNOVNI POJMOVI Prilikom bilo kakvog merenja moguće je napraviti grešku. Da bi se ta greška definisala mora se prepoznati njena priroda ili tip, a zatim i veličina.

1.1. DEFINICIJA GREŠAKA Greška je mera odstupanja izmerene vrednosti od prave vrednosti. Po prirodi ona može biti apsolutna i relativna. Prema svom tipu sistematska i slučajna.

1.1.1. Apsolutna greška

Apsolutna greška je brojna vrednost i u isto vreme fizička veličina koja opisuje razliku između prave i izmerene vrednosti izražena u jedinicama u kojima je izražena merena vrednost. Ako je, na primer, stvarni sadržaj zlata u nekoj rudi 100 g/t (100 g Au u 1 toni rude) i ako je izmerena vrednost 90 g/t Au u rudi, tada je apsolutna greška -10 g/t.

1.1.2. Relativna greška Relativna greška je brojna vrednost koja se iskazuje kao udeo (frakcija) apsolutne greške u veličini stvarne vrednosti ili srednje vrednosti više merenja. Polazeći od prethodnog primera

relativna greška iznosi:

∆AA

ili u procentima

∆ 100*AA

%.

Na primer, ( )( ) 1,0

/100/10

=

tgtg

, ili izraženo u procentima ( )

( ) %10100*/100/10

=

tgtg

. Kako se vidi

relativna greška se ne definiše jedinicama u kojima su vršena merenja, već je to relativna vrednost izražena u procentima koji pokazuju koliko je greška velika u odnosu na pravu ili srednju vrednost više merenja.

1.1.3. Sistematska greška

Sistematska greška se ne može svrstati u grupu brojnih vrednosti koje opisuju veličinu greške, već u specifičan tip greške koji se može ustanoviti, a koji sistematski menja vrednost određenog seta merenja za neku određenu vrednost, ona uvek ima isti znak i veličinu (ovo odstupanje neki nazivaju “bias”). Tipičan primer je dućanska vaga koja sistematski greši, na primer, standardno dodaje na 1 kg 100 grama. Ako kupujete mlevenu robu, iako očitana vrednost kaže da imate 1 kg mlevene robe u kesi se stvarno nalazi samo 900 g. Ako kupujete 2 kg robe u kesi će se nalaziti samo 1900 g itd. Sistematska greška može da bude vrlo kompleksna, ali ako je prepoznate, onda se svaki rezultat može uspešno modifikovati tj, preračunati i tako dobiti prava vrednost.

1.1.4. Slučajne greške Slučajne greške su uvek prisutne pri bilo kakvom merenju. Kod ovih grešaka se, na žalost, ne može ustanoviti veličina niti predznak u kome će se razvijati. Iako nepredvidive slučajne greške imaju jednu dobru osobinu, a to je da se veoma dobro uklapaju u statistička pravila. Veličina ovih grešaka umanjuje se samo povećanim brojem merenja iste veličine ili probe.

1.2. NESIGURNOST PRI MERENJU

Ivan Gržetić, HF 2

Page 3: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Za nesigurnost pri merenju postoji niz razloga. To mogu biti individualni razlozi – oni koji zavise od operatera koji meri i tehnički razlozi oni koji zavise od instrumenta kojim se meri. Prvi su promenljivi, sticanjem iskustva operater postaje sve sigurniji u radu i time utiče na smanjenje greške, ali sa promenom operatera nesigurnost postaje ponovo velika. Drugi ili tehnički razlozi su vezani za performanse uređaja i stabilnost ili reproduktivnost uslova rada. Ako je uređaj konstruisan da meri krupne promene onda se sa njim ne mogu meriti male promene. Razlike u težini na nivou grama ne mogu se meriti vagom koja meri tone, ili sa metrom čija je podela na santimetre ne mogu se procenjivati dužine na delove milimetra, to je moguće samo ako je podela na metru data u milimetrima čime se ostvaruju preduslovi da se daju procene o delovima milimetra (slika 1). Nesigurnost merenja u prvom slučaju daleko je veća nego u drugom slučaju.

Slika 1. Merenje dužine sa dve vrste metra: koji ima grubu

podelu (na santimetre) i koji ima finu podelu (na milimetre).

Kaka smo svesni da nesigurnost u merenju postoji tada se određena veličina pre daje kao veličina koja se nalazi u nekom intervalu mernih vrednosti nego kao pojedinačna vrednost.

1.3. PRECIZNOST

Preciznost je mera ukupne slučajne greške ili dokaz o visokoj reproduktivnosti merenja. Veoma precizno merenje ima veoma malu slučajnu grešku. Set preciznih merenja pokazuje da se takva merenja veoma malo međusobno razlikuju tj, da je reprodukcija rezultata merenja takva da se oni neznatno razlikuju. Na žalost, sva precizna merenja ne moraju uvek da budu i tačna. Ako merni instrument pravi stalnu i sistematsku grešku onda takav instrument ugrađujue u svako merenje svoju grešku koja je uvek ista, pa su zato i rezultati merenja precizni, ali i netačni jer odstupaju od prave vrednosti baš za onoliko kolika je sistematska greška mernog instrumenta.

Slika 2. Precizan i netačan Slika 3. Precizan i tačan

1.4. TAČNOST Tačnost opisuje koliko je veliko ukupno odstupanje seta merenih vrednosti od prave vrednosti. Set merenja može da bude veoma tačan jer se samo neznatno razlikuje od prave vrednosti, ali po pitanju preciznosti može da bude i precizan i neprecizan. Tačan i precizan set

Ivan Gržetić, HF 3

Page 4: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

merenja je onaj kod koga se sva pojedinačna merenja neznatno razlikuju od prave vrednosti. Tačan i neprecizan set merenja je onaj koji ima vidnu disperziju rezultata oko prave vrednosti, dakle onaj koji ima merenja sa relativno ujednačenim pozitivnim i negativnim (velikim i malim) odstupanjima u odnosu na pravu vrednost.

Slika 4. Tačan i neprecizan Slika 5. Tačan i precizan

1.5. PROMAŠENO MERENJE

Promašeno merenje ili omaška pri merenju je poseban vid greške koji se može prepoznati usled svog značajnog odstrupanja od prave vrednosti ili srednje vrednost više merenja. Merni promašaj su prisutni kako kod preciznih tako i kod nepreciznih merenja. Takvim greškama treba pridavati posebnu pažnju jer svojim „nenormalnim” vrednostima mogu znatno da iskvare srednju vrednost više merenja i time da prouzrokuju pogrešno zaključivanje ili neke druge neželjene posledice. U slučaju preciznih merenja ovakvu vrednost je lako prepoznati, ali kod nepreciznih merenja to može da iskomplikuje čitavu stvar oko prepoznavanja da li je dato merenje zaista promašeno ili je nastalo kao posledica nepreciznosti. Za ovakvu vrstu problematičnih rezultata merenja postoji poseban postupak njihovog prepoznavanja i odbacivanja.

Slika 6. Precizno sa jednim promašenim

merenjem Slika 7. Neprecizno sa jednim promašenim

merenjem

1.6. SIGURNE CIFRE Pri analitičkim određivanjima brojevi se koriste radi opisivanja kvntiteta (dužine, težine...), odnosno sadržaja neke supstance ili elementa u nekoj probi. Prilikom određivanja kvantiteta nisu uvek sve brojne cifre sigurne (signifikantne) pa zato treba razlikovati sigune od nesigurnih cifara. Najbolji načina da se razume pojam sigurnih i nesigurnih cifara jeste primer iz slike 1. Rastojanje između dve tačke na slici može se meriti sa metrom koji ima grubu podelu samo na santimetre ili metrom koji ima finu podelu na milimetre. U prvom slučaju (grublja podela) sa sigurnošću se određuje dužina u santimetrima, a procenjuje se dodatno broj milimetrara tako da se merenje može opisati sa brojem 6,3 cm ili sa brojem 6,4 cm. Prva cifra (6) je sigurna, a druga (3 ili 4) nesigurna, jer je sasvim očigledno

Ivan Gržetić, HF 4

Page 5: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

da se ne zna tačno da li iza 6 cm dolazi 3 mm ili 4 mm da bi se tačno opisalo rastojanje između tačaka. U drugom slučaju (finija podela), s obzirom da je merni instrument bolji, sa sigurnošću se određuje dužina u santimetrima i milimetrima, a procenjuje se dodatno broj delova milimetrara tako da se merenje može opisati sa brojem 6,35 cm ili sa brojem 6,36 cm. Prva cifra (6) je sigurna i druga cifra (3) je sigurna, što je očigledno, a tek treća cifra (5 ili 6) je nesigurna, jer se ne zna tačno da li su u pitanju 0,5 mm ili 0,6 mm koji dolaze iza 6,3 cm da bi se tačno opisalo rastojanje između tačkama. Sada je sasvim jasno da finoća ili osetljivost mernog uređaja utiče na broj sigurnih cifara kojima se opisuje neka veličina. Po konvenciji uvek je poslednja cifra nesigurna i zato se mora voditi računa sa koliko cifara se iskazuje neki rezultat. Ako se iz primarnog rezultata isključi poslednja (nesigurna) cifra rezultat postaje netačniji jer se po konvenciji poslednja cifra uvek smatra nesigurnom. Ako se u primarnom rezultatu iza nesigurne cifre doda još jedna cifra dobija se lažno precizniji rezultat jer dodatkom još jedne cifre u rezultat prethodno nesigurna cifra postaje sigurna. Merenje rastojanja između tačaka na slici 1 metrom sa finijom podelom dalo je rezultat 6,35 cm. Ukidanjem zadnje cifre dobija se 6,3 cm i rezultat se automatski prevodi u klasu merenja koje je rađeno grubljim metrom. Dodatkom cifre na merenje dobija se 6,350 cm što dale lažni utisak da je merenje vršeno preciznijim metrom nego što on stvarno jeste. Nula ima dvojaku ulogu u priči o sigurnim ciframa. Ako se nalazi između dva broja koji se razlikuju od nule (na primer: 504) onda je i ona sigurna cifra. Ako se nule nalaze s desne strane broja (na primer: 200) tada predstavljaju sigurne cifre ili ako se nalaze iza decimalnog zareza (na primer: 2,00) i tada predstavljaju sigurne. Ako se nule nalaze s leve strane broja: prva leva, druga leva cifra ... (na primer, 0,0121) tada ne predstavljaju sigurne cifre. Prilikom sabiranja ili oduzimanja brojeva, koji opisuju neka merenja, sa različitim brojem cifara tačnost definiše onaj broj koji ima najmanju preciznost (ovde se ne uzimaju u obzir sigurne cifre). Za niz brojeva koji opisuju masu: 0,0121 g, 25,64 g i 1,05782 g zbir je sledeći:

0,01 g + 25,64 g + 1,06 g = 26,71 g. U ovom nizu merenja najnepreciznije merenje je sa dve decimale: 25,64 g jer je merenje vršeno samo do stotih delova grama. Duga merenja su preciznija, ali prethodno pomenuto je ograničavajuće. Tada se brojevi zaokružuju, poštujući pravila zaokruživanja, do broja decimala koji definiše broj sa najmanjom preciznošću, a tek onda se sabiraju. Prilikom množenja ili deljenja brojeva, koji opisuju neka merenja, sa različitim brojem cifara broj cifara u proizvodu ili količniku definiše onaj broj koji ima najmanji broj sigurnih cifara. Za niz brojeva: 0,0121 , 25,64 i 1,05782 proizvod je sledeći:

0,0121 * 25,64 * 1,05782 = 0,328 s obzirom da broj 0,0121 ima najmanji broj sigurnih cifara (2 cifre: 0,0121 , u ovom slučaju nule se ne računaju kao sigurne cifre jer su s leve strane), to će proizvod imati takođe 2 sigurne cifre (0,328) plus treću (zadnju) nesigurnu cifru. 2. STATISTIČKA ANALIZA GREŠKE Proučavanje osobina slučajne greške otvara sasvim novo poglavlje u analizi grešaka, a to je statistička analiza. Uzroci nastajanja slučajnih grešaka veoma su brojni i složeni, mada se neku uzroci mogu naslutiti. To mogu biti trenutne nestabilnosti u radu aparata kojim se vrši merenje (takozvani „drift”), posledice Hajsenbergovog principa nesigurnosti, promene temperature i drugi nekontrolisani efekti. Srećom sve slučajne greške podležu određenim zakonima distribucije koji se mogu definisati. Gausov zakon distribucije se pokazao kao izvanredan za opis distribucije grešaka i može se opisati simetričnom krivom. Matematički

Ivan Gržetić, HF 5

Page 6: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

obrazac krive obuhvata verovatnoću koja definiše raspodelu pojavljivanja bilo koje slučajne greške pri merenju.

2.1. TERMINOLOGIJA Statistička analiza greške koristi posebnu terminologiju koja koja pre svega obuhvata pojmove koji se koriste pri analizi greške.

2.1.1. Verovatnoća i statistika Verovatnoća je deo matematike koja se bavi izračunavanjem mogućnosti da se neki događaj stvarno dogodi i izražava se brojevima od 0 do 1. Ako se za neki događaj uspostavi da ima verovatnoću događajna ravnu jedinici onda se za njega kaže da je neizbežan ili potpuno siguran. Verovatnoća nekog događaja može se odrediti eksperimentalno i konteplativno (na bazi logičkog razmišljanja). Eksperimentalno određivanje obuhvata ponavljanje nekog eksperimenta (pokušaja), za koji se zna da može da produkuje dati događaj, dovoljno veliki broj puta i na kraju se odredi verovatnoća tako što se frekvenca pojavljivanja datog događaja podeli sa ukupnim brojem pokušaja (eksperimenata). Na primer, da bi se odredilo kolika je verovatnoća da će se bacanjem kocke pojaviti broj 6 kocka se baca milion puta. U tako velikom broju bacanja broj šest se pojavio 166.549 puta. Prost račun kaže da je verovatnoća pojavljivanja broja šest jednaka 166.549 / 1.000.000 = 0,166549, ili 1/6 od ukupnog broja bacanja. Konteplativno određivanje polazi od razmišljanja da je kocka idealna, da ima 6 strana i da su svih 6 strana kocke međusobno jednake. Bacanjem kocke ni jedna strana nema nikakvu prednost nad drugim stranama, to znači da je šansa pojavljivanja bilo koje od strana kocke jednaka sa svim ostalim, odnosno da je verovatnoća da će se pojaviti jedna određena strana kocke među 6 strana jednaka 1/6. Logično je zaključiti i da je verovatnoća pojavljivanja broja 6 pri bacanju kocke jednaka 1/6. Iako se verovatnoća izražava brojevima od 0 do 1 ponekad se ti brojevi množe sa 100 pa se tada verovatnoća izražava u procentima (%). Statistika je poseban vid matematičke obrade većeg broja podataka (seta merenja ili proba) koji daje numeričke podatke ili parametre o nekom uzorku ili populaciji kao što su: aritmetička sredina, geometrijska sredina, medijana, varijansa, standardna devijacija, i slično. Reč statistika koristi se dvojako. U širem smislu statistika obuhvata tehnike i procedura za analizu podataka, njihovu interpretaciju i prikazivanje kao i postupke donošenja zaključaka na bazi izvršene analize. U užem smislu statistika nije ništa drugo nego ciljana numerička obrada podataka.

2.1.2. Populacija, uzorak, proba i oprobavanje Populacija obuhvata sve objekte, posmatranja ili merenja koja međusobno imaju nešto zajedničko. Po svojim osobinama populacija može biti u potpunosti virtuelna, na primer, obuhvata sva merenja koja mogu da se načine prilikom ispitivanja neke analitičke probe, a njih može u idealnom slučaju (teorijski) da bude bezbroj. Uzorak predstavlja set konkretnih merenja ili ispitivanja, odnosno proba koje teže da što bolje reprezentuju datu celinu ili populaciju. Ako se pretpostavi da je populacija skup svih mogućih merenja (kojih teorijski ima veoma mnogo - bezbroj), onda je proba samo podskup tog skupa jer sadrži samo jedan ograničen (relativno mali) broj merenja. U širem smislu rudno ležište, zagađeno područje, procesna sirovina ili procesni proizvod čini skup svih mogućih proba na koje ovi mogu da se razdele, ili od kojih ovi mogu da se naprave – sve te probe čine jednu populaciji. Nemoguće je načiniti toliki uzorak, a i nema smisla, koji će apsorbovati celu populaciju. Poznajući ove definicije i objašnjenja potrebno je razlikovati statistiku populacije

Ivan Gržetić, HF 6

Page 7: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

i statistiku uzorka, jer se ove razlikuju pogotovu ako je broj merenja koja čine uzorak manji od 30. Što je uzorak veći, dakle, što je broj proba u uzorku veći, to će uzorak biti reprezentativniji za datu populaciju. Polazeći od definicije uzorka moguće je pokušati da se određena populacija reprezentuje sa smo jednom probom i otuda izvor nesporazuma koji nastaju oko pojmova uzorak i proba, jer se obično za pojam uzorka vezuje samo jedno merenje ili samo jedna analitička proba. Zato treba voditi računa o razlici između statističkog uzorka i analitičke probe. Proba je, dakle, deo nekog supstrata (celine) koji je uzet radi laboratorijskog ispitivanja. Oprobavanje je proces uzimanja proba. Pojam uzorkovanja se često izjednačava sa pojmom oprobavanja, mada se prvi pre odnosi na broj i kvalitet reprezenata koji opisuju određenu populaciju sa verovatnoćom i statistikom koja iz njih proizilazi, što znači da ovaj pojam ima pre svega matematičko značenje, a drugi, oprobavanje, ima više fizički smisao i odnosi se na proces uzimanja proba (reprezenata), strateguju i plan oprobavanja.

2.1.3. Odstupanje ili devijacija Već tokom definisanja tačnosti uveden je pojam odstupanja ili devijacije i odnosi se na odstupanje merene vrednosti od prave vrednosti. Svaka merena vrednost ima svoje sopstveno odstupanje od prave vrednosti, a to odstupanje će predstavljati pojedinačnu grešku tog merenja. Što je veći broj merenja to će biti i veći broj pojedinačnih odstupanja. Raspodela devijacija od kojih su neke veće, a neke manje, povinovaće se zakonima verovatnoće. To znači da će merenja sa velikim devijacija biti retka u odnosu na broj merenja sa malim devijacija koja su vrlo učestala. Pokazalo se da se merenja sa malim devijacijama okupljaju oko neke srednje vrednosti (slika 9).

2.2. DESKRIPTIVNA STATISTIKA

Deskriptivna statistika obuhvata poseban vid matematičke obrade mernih podataka koja daje egzaktne vrednosti za aritmetičku, geometrijsku i harmonijsku srednju vrednost, varijansu, standarnu devijaciju i slično.

2.2.1. Setovi merenja i distribucija rezultata Tokom analiziranja neke pojave ili merenja neke veličine može se dobiti niz različitih rezultata koji se mogu svrstati u određen set merenja. U zavisnosti šta se analizira ili meri dati set merenja može dati rezultate koji se mogu predstaviti kao na slici 8. Kako se vidi raspodela rezultata u datom setu (uzorku koji reprezentuje datu pojavu ili veličinu) može biti nesimetrična (deformisana) ili simetrična (nedeformisana). Nesimetrična raspodela (slike 8a i 8b) karakteristina je za takozvano linijsko oprobavanje, a pojavljuje se i u slučajevima kada se pri uzorkovanju uzme suviše mali broj uzoraka, ili kada se radi o set koji nema simetričnu raspodelu već, na primer, Puasonovu raspodelu. Simetrična raspodela karakteristična za takozvano tačkasto oprobavanje, odnosno merenje jedne te iste veličine u više navrata. Za ovakav set se kaže da ima normalnu raspodelu (slika 8c) i na njega se može primeniti odgovarajuća statistička obrada koja se bazira na normalnoj raspodeli. Ukiliko set merenja nema normalno distribuisane vrednosti merenja na njega se ne može primeniti odgovarajuća statistička obrada koja se bazira na normalnoj raspodeli. U slučajevima kada je set merenje takav da su merenja nesimetrično raspodeljena, onda treba pokušati da se deformisana raspodela popravi sa povećanjem broja merenja do normalne raspodele.

Ivan Gržetić, HF 7

Page 8: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Poseban vid simetrične raspodele jeste bimodalna raspodela (slika 8d) na koji se takođe ne može primeniti statistička obrada koja se bazira na normalnoj raspodeli sve dok se probe ne razdvije tako da se mogu svrstatu dva seta merenja sa uobučajenom normalnom raspodelom. Generalmo posmatrano pored normalne raspodele koja je prepoznatljiva kao Gausova (normalna) raspodela postoje i drugi tipovi raspodele kao: gama, eksponencijalna, Reilaitova, Raisova, Poasonova raspodela i druge. Svaka od ovih raspodela može se matematički obraditi i prikazatai odgovarajućom matematičkom funkcijom, kao uostalom i Gausova raspodela. Posebno se naglašava da će se u ovom tekstu izučavati samo Gausova (normalna) raspodela za koju je razvijena najopširnija statistička obrada, sve ostale raspodele izlaze iz okvira ovog teksta.

(a) Nadesno ili pozitivno deformisana raspodela

(b) Nalevo ili negativno deformisana raspodela

(c) Nedeformisana - simetrična

ili normalna raspodela (d) Simetrična bimodalna

raspodela Slika 8. Deformisane i simetrične raspodele

Često su setovi merenja obimni, nepraktični za sveobuhvatno prikazivanje i zato se među stručnjacima razvila opravda potreba da se dati set prikaze na što koncizniji i jednostavniji način. Tako, na primer, prva pomisao se odnosi na to kako neki set od više merenja prikazati samo sa jednom vrednošću, s tim što ta vrednost mora da odrazi u što većoj meri kojoj centralnoj vrednosti dati set teži. Težnja nekoj centralnoj vrednosti iskazuje se kroz srednju vrednost koja može da se odredi na nekoliko načina: aritmetičkim putem, geometrijskim putem ili nekom još jednostavnijim putem. Srednja vrednost se, dakle, ne može određivati uvek na isti način, već, od sučaja do slučaja, u zavisnosti kakva je raspodela rezultata nekog seta merenja, odnosno oprobavanja.

2.2.2. Aritmetička srednja vrednost Ako se tokom merenja ispita nekoliko proba istog ili sličnog porekla, odnosno ako se obavi nekoliko analiza ili merenja jedne te iste probe onda se dobija set rezultata koji se više ili manje, odnosno neznatno međusobno razlikuju: x1, x2, x3, x4, x5 i koji su simetrično distribuirane oko neke srednje vrednosti. Srednja vrednost teži da se izjednači sa pravom vrednošću (µ) koja je nama ustvari nepoznata. Neka se uzorak, na primer, sastoji od pet merenja. Na bazi ovog uzorka treba doneti nekakav zaključak. Prvo pitanje koje se postavlja jeste koliko su data merenja tačna i precizna? Ukoliko se ne zna prava vrednost potrebno je pronaći takvu vrednost koja će biti najverovatnije najbliža pravoj

Ivan Gržetić, HF 8

Page 9: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

vrednosti. U tu svrhu posluži će srednja vrednost (µ). Što je veći broj pojedinačnih merenja to će srednja vrednost biti bliža pravoj vrednosti ( x ~ µ). Aritmetička srednja vrednost x (aritmetička sredina) odgovara aritmetičkoj sredini svih pojedinačnih merenja od x1 do xn. Oznaka N odnosi se na egzaktan broj merenja (N = 5). Iz ovoga sledi da je:

Nxxxxxx 54321 ++++

= ili u generalnom slučaju N

xx

N

ii∑

== 1 .

Srednja vrednost se može takođe definisati i kao najverovatnija vrednost u Gusovoj standardnoj raspodeli. Ako su pojedinačna merenja: 3,22, 3,32, 3,44, 3,40 i 5,94 onda je:

x = (3,22 + 3,32 + 3,44 + 3,40 + 5,94)/5 = 19,32/5 = 3,86 . Aritmetička sredina je, dakle, relevantna onda kada se sabiranjem svih elemenata nekog seta dobija zbir za koji se želi saznati kolika je prosečna veličina elementa tog seta. Sabiranjem prosečnih veličina seta dobija se isti zbir kao i sabiranjem pravih vrednosti elemenata seta:

3,22 + 3,32 + 3,44 + 3,40 + 5,94 = 3,86 + 3,86 + 3,86 + 3,86 + 3,86 = 19,32

2.2.3. Geometrijska srednja vrednost Geometrijska srednja vrednost (geometrijska sredina) predstavlja n-ti koren proizvoda n brojeva koji su dobijeni u N merenja.

Geometrijska srednja vrednost nni xxxx *** 21=

Ako su pojedinačna merenja ista kao i u prethodnom slučaju tada je:

Geometrijska srednja vrednost 5 94,5*40,3*44,3*32,3*22,3= 5 71,742= = 3,75 Izračunavanje geometrijske sredine nema nikakvog smisla ako je bilo koje merenje u nizu merenja jednako nuli ili ima negativnu vrednost. Geometrijska sredina je, dakle, relevantna onda kada se množenjem svih elemenata nekog seta dobija proizvod za koji se želi saznati kolika je prosečna veličina elementa tog seta. Množenjem prosečnih veličina seta dobija se isti proizvod kao i množenjem pravih vrednosti elemenata seta:

3,22 * 3,32 * 3,44 * 3,40 * 5,94 = 3,75 * 3,75 * 3,75 * 3,75 * 3,75 = 742,71 Važna osobina geometrijske sredine je da se na nju daleko manje odražavaju eksremne vrednosti nego na eritmetičku sredinu. Izuzetno je korisna kada se želi odrediti srednja vrednos nekog seta koji ima deformisanu raspodelu, kao, na primer, na slici 8a. Geometrijska sredine se koristi onda kada treba da se pronadje prosečna stopa neke promena, a ne prosečna promena. Na primer, neka se sa porastom proizvodnje neke fabrike menjao nivo emisije nekog zagađivača u odnosu na prethodnu godinu. Ako je prve godine prosečni porast iznosio 10%, drige godine 50%, a treće 30%, koliki je ukupan porast zagađenja?

Ivan Gržetić, HF 9

Page 10: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Prve godine porast zagađenje je iznosilo 1,1 , drige godine 1,5 , a treće 1,3 puta veći u odnosu na prethodnu godinu. Kolika je prosečna stopa promene stepena zagađenja godišnje u ove tri godine?

• Geomteriska sredina je 3 = 1,289, ili prosečna stopa porasta je 28,9% godišnje.

3,1*5,1*1,1

• Aritmetička sredina porasta je (10%+50%+30%)/3 = 30% godišnje. Neka je startna vrednost zagađenja iznosila, na primer, 200 mg/m3, onda je tokom prve godine nivo zagađenja iznosio: 200*1,1 = 220 mg/m3; druge godine: 220*1,5 = 330 mg/m3; i treće godine: 330*1,3 = 429 mg/m3. Polazeći od aritmetičke sredine porast u prvoj godini bi bio 200*1,3 = 260 mg/m3; druge godine: 260*1,3 = 338 mg/m3; i treće godine: 338*1,3 = 439,4 mg/m3. Polazeći od geometrijske sredine porast u prvoj godini bi bio 200*1,289 = 257,8 mg/m3; druge godine: 257,8*1,289 = 332,3 mg/m3; i treće godine: 332,3*1,289 = 428,3 mg/m3. Sada se sasvim lako vidi da je upotreba geometrijske sredine bilo isprasvnije nego upotreba aritmetičke sredine.

2.2.4. Medijana Medijana (M) se uvek nalazi na sredini nekog seta merenja tj, uzorka. Svi elementi seta su podeljeni u dva dela od kojih se jedan nalazi ispod, a drugi iznad medijane. Ukoliko uzorak ili set merenja ima neparan broj elemenata i ako su elementi poređani po veličina onda medijanu čini srednji član. Na primer, za set merenja: 3,22, 3,32, 3,44, 3,40 i 5,94 prvo se članovi poređaju po veličini: 3,22, 3,32, 3,40, 3,44 i 5,94, pa se potom računa medijana koja iznosi M = 3,40. Ukoliko uzorak ili set merenja ima paran broj elemenata i ako su elementi poređani po veličina onda medijanu čini aritmetička sredina dva srednja člana. Na primer, za set merenja: 3,22, 3,32, 3,44 i 3,40 prvo se članovi poređaju po veličini: 3,22, 3,32, 3,40 i 3,44, a medijana je (3,32 + 3,40)/2 ili M = 3,36. Kao i geometrijska sredine medijana je mnogo neosetljivija na ekstremne vrednosti nego aritmetička sredina.

2.2.5. Kvartili Kvartili su numeričke vrednosti koje dele set merenja (uzorak) u četiri grupe u okviru kojih se nalazi, ako je to moguće, jednak broj merenja. Prvi kvartil (K1) nekog seta merenja je broj koji deli dati set tako da se ispod njega nalazi 25%, a iznad njega 75% od ukupnog broja pojedinačnih merenja koja pripadaju tom setu. Drugi kvartil nije ništa drugo nego medijana (M) i predtavlja broj koji deli dati seta merenja tako da se ispod njega nalazi 50% i iznad njega 50% od ukupnog broja pojedinačnih merenja koja pripadaju tom setu. Treći kvartil (K3) nekog seta merenja je broj koji deli dati set tako da se ispod njega nalazi 75%, a iznad njega 25% od ukupnog broja pojedinačnih merenja koja pripadaju tom setu. Moglo bi se reći da je prvi kvartil medijana donje polovine seta koju deli medijana celog seta merenja, a treći kvartil medijana gornje polovine istog seta.

Ivan Gržetić, HF 10

Page 11: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Evo primera, neka se jedan set merenja (sa neparnim brojem elemenata) sastoji od sledećih pojedinačnih vrednosti (medijana ovog seta je 61 ili M = 61):

15 26 34 44 50 61 62 74 77 88 99.

Donju polovinu seta čine brojne vrenosti: 15 26 34 44 50. Medijana ovog seta je broj 34 i on predstavlja prvi kvartil (K1 = 34). Gornju polovinu seta čine brojne vrednosti: 62 74 77 88 99. Medijana ovog seta je broj 77 i on predstavlja treći kvartil (K3 = 77). Podvlačenjem brojne vrednosti za svaki kvartil dati set se kvartilima deli na četiri jednake grupe po broju pojedinačnih merenja:

15 26 34 44 50 61 62 74 77 88 99. Evo drugog primera, neka se drugi set merenja (sa parnim brojem elemenata) sastoji od sledećih pojedinačnih vrednosti (medijana ovog seta je 14,5):

11 12 13 14 14 * 15 16 17 17 18.

Podvlačenjem brojne vrednosti za svaki kvartil dati set se kvartilima deli na četiri jednake grupe po broju pojedinačnih merenja:

11 12 13 14 14 * 15 16 17 17 18. Interkvartilni raspon (IKR) je raspon mernih vrednosti koji obuhvata sve merene vrednosti od I do III kvartila (50% od svih merenja) i u poslednjem slučaju odnosi se na merenja koja se nalaze u rasponu od od 13 do 17 i iznosi 4 (IKR = K3 – K1 = 17 – 13 = 4).

2.2.6. Gausova ili normalna raspodela

Prilikom izvođenja nekog niza merenja u svaki rezultat ugrađuje se slučajna greška. Te greške se razlikuju od merenja do merenja. Kada se načini veoma veliki broj merenja uočava se nekakva zakonitost u pojavljivanju slučajnih grešaka. Ta zakonitost se odnosi kako na njihovu distribuciju, tako i veličinu. Pomenuta zakonitost se najbolje objašnjava verovatnoćom, a po svojoj prirodi podleže verovatnoći normalne raspodele koja se matematički opisuje Gausovom jednačinom normalne raspodele. Dovoljno veliki broj merenja određene nepoznate veličine simetrično se raspodeljuje oko neke srednje vrednosti (slika 9), dakle, greške sa pozitivnim i negativnim odstupanjima biće jednako zastupljene. Simetrična raspodela može lako da se definiše matematičkom funkcijom (slika 10).

Slika 9. Simetrična raspodela x merenja. Slika 10. Gausian – matematička kriva koja

opisuje simetričnu ili normalnu raspodelu.

Ivan Gržetić, HF 11

Page 12: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Matematička funkcija Gausove normalne raspodela ( ) opisuje učestalost kojom se javlja neka devijacija (odstupanje od prave vrednosti):

gf

−−

=2

2

2)(

221)( σ

πσ

xx

g exf

gde su: vrednost funkcije na y osi za datu devijaciju (x -)(xfg x ), x merena vrednost, x srednja vrednost, π Ludolfov broj (3,14159), e osnova prirodnog logaritma (2,71828), σ standardna devijacija. Gausovu krivu definišu dva osnovna parametra σ i x , prvi definiše širinu zvona funkcije, a drugi položaj u odnosu na x osu. Učestalost pojavljivanja mernih rezultata sa malom devijacijim daleko je veća od učestalosti pojavljivanja mernih rezultata sa velikom devijacijim.

2.2.7. Matematička transformacija deformisanih raspodela

Kao što je to ranije opisano (slika 8) nisu sve raspodele simetrične, zato je sasvim opravdano i legitimno da se nesimetrične raspodsele transformišu, ako je to moguće, u simetrične. Svakako treba imati u vidu da matematičko transformisane deformisanih ili nesimetričnih raspodela ne mora uvek da bude uspešno. Postoji nekoliko matematičkih transformacija koje su se pokazale kao najbolje:

• Izračunavanje kvadratnog korena za svaku pojedinačnu vrednost nalevo ili negativno deformisane raspodele (slika 8b) može da takvu raspodelu pretvori u normalnu raspodelu. Na primer, ovaj postupak Puasonovu raspodelu transformiše u normalnu raspodelu,

• Izračunavanje kvadrata za svaku pojedinačnu vrednost nadesno ili pzitivno deformisane raspodele (slika 8a) može da takvu raspodelu pretvori u normalnu raspodelu,

• Izračunavanje logaritamske vrednosti u setu podataka koji se eksponencijalno menja može da takvu raspodelu pretvori u normalnu raspodelu,

• Izračubavanje recipročne vrednosti za svaku vrednost u setu podataka koji se eksponencijalno menja može da takvu raspodelu pretvori u normalnu raspodelu,

• Deformisana raspodela neki put može da bude transformisana tako što će svaka vrednost u setu biti podeljena ili pomnožena sa medijanom, itd.

Ako se matematičkom transformacijom postigne željeni efekat – da se dobije normalna raspodela, onda se može na dati set primeniti uobičajena statistička analiza, ali se mora uvek imati u vidu da su statističi podaci relevantni za transformisani set, a ne za originalni. Da bi se diskutovao originalni set uvek treba uraditi povratnu matematičku transformaciju kako bi se tačno znalo koje su to odgovarajuće vrednosti koje su usklađenene sa originalnim setom. Na primer, za set podataka: 2, 3, 3, 4, 15 treba odrediti kojoj centralnoj vrednosti ovaj set teži ili drugim rečima koja je srednja vrednost ovog seta koji je sasvim sigurno nalevo ili negativno deformisan (nešto slično primeru na slici 8b).

• Aritmetička sredina originalnog seta (2 + 3 + 3 + 4 + 15)/5 = 5,4, nije odgovarajuća vrednost.

• Geometrijska sredina za ovaj set bi bila 5 = 4,043. 15*4*3*3*2

Ivan Gržetić, HF 12

Page 13: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Matematička transformacija – logaritmovanje za osnovu 10, pokazala se kao vrlo korisna pri čemu se dobijaju vrednosti koje imaju normalnu raspodelu:

0,301 , 0,477 , 0,477 , 0,622 , 1,176 za koje je moguće izračunati aritmetičku sredinu, ali sada logaritmovanih vrednosti, koja iznosi (0,301 + 0,477 + 0,477 + 0,622 + 1,176)/5 = 0,622. Antilogaritmovanjem ove vrednosti (100,622) dovija se 4,043. Matematička transformacija je, dakle, omogućila da se primeni aritmetička sredina i na set sa deformisanom raspodelom, tako da su se u konačnom slučaju izjednačili podaci dobijeni na dva načina: (1) na osnovu geometrijske sredine i (2) na osnovu aritmetičke sredine transformisanog skupa. Još jednom treba isaći da matematička transformacija nije uvek svemoguća tako da se u određenim slučajevima moramo zadovoljiti i sa „običnom“ medijanom.

2.2.8. Standardna devijacija pojedinačnog merenja Mera za tačnost koja se ponekad koristi u analitičkoj praksi je prosečna devijacija (δ) pojedinačnog merenja koja predstavalja srednju vrednost apsolutnih vrednosti razlika između merenih vrednosti i aritmetičke sredine za određen broj merenja:

Prosečna devijacija pojedinačnog merenja =N

xxN

ii∑

=

−= 1

||δ

gde su: xi pojedinačna merena vrednost (i-ta merena vrednost), x aritmetička sredina, | xi - x | apsolutna vrednost odstupanja (devijacije) za i-to merenje, a N broj merenja. Pored prosečne devijacije mnogo češće se koristi standardna devijacija (σ) pojedinačnog merenja koja se definiše kao kvadratni koren zbira kvadrata razlika između merenih vrednosti i aritmetičke sredine:

Standardna devijacija pojedinačnog merenja =N

xxN

ii∑

=

−= 1

2)(σ

Standardna devijacija je bolja mera za tačnost nego prosečna devijacija, jer ona uzima u obzir disperziju devijacije (rasejanje odstupanja ili rasejanje grešaka). Pošto je prava vrednost µ ustvari nepoznata, već je poznata samo srednja vrednost x koja teži pravoj vrednosti, to je vrlo značajno pitanje da li će se prava vrednost nalaziti u blizini srednje vrednosti i koliko je od nje udaljena. Jedini način da se odgovori na ovo pitanje jeste da se pozove u pomoć verovatnoća. Verovatnoća da će se stvarna vrednost naći u intervalu ( x ± σ) je ravna površini koja se nalazi ispod Gausove krive u tom intervalu. Kriva je tako normalizovna da je ukupna površina ispod krive jednaka jedinici, a to znači da je ukupna verovatnoća da kriva obuhvata sva moguća odstupanja od prave ili srednje vrednosti pri bilo kom merenju jednaka 1. Teorijski posmatrano ako je načinjen beskonačno veliki broj merenja jedno od tih merenja mora da bude jednako pravoj vrednosti. U jednom setu većeg broja merenja na bazi verovatnoće rezultati će se distribuirati na sledeći način (slika 10):

• 34,13 % merenja će pasti u interval ( x - σ), zatim još 34,13 % merenja će pasti u interval ( x + σ), odnosno 68,26 % merenja će ući u interval od ( x ± σ), to znači da će u 68,26 slučajeva od 100 merenja greška merenja svakog pojedinačnog merenja biti

Ivan Gržetić, HF 13

Page 14: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

manja od ±σ, ili drugim rečima verovatnoća da će prava vrednost ući u interval od ( x ± σ) nije stopostotna, već iznosi 68,26 %;

• (13,59 + 34,13) % ili 47,72 % merenja će pasti u interval ( x - 2σ), zatim još 47,72 % % merenja će ući u interval ( x + 2σ), odnosno 95,44 % merenja će pasti u interval od ( x ± 2σ) to znači da će u 95,44 slučajeva od 100 merenja greška merenja svakog pojedinačnog merenja biti manja od ±2σ, ili drugim rečima verovatnoća da će prava vrednost ući u interval od ( x ± 2σ) još uvek nije stopostotna, već iznosi 95,44 %;

• (2,14 + 13,59 + 34,13) % ili 49,86 % merenja će pasti u interval ( x - 3σ), zatim još 49,86 % merenja će ući u interval ( x + 2σ), odnosno 99,72 % merenja će pasti u interval od ( x ± 3σ), to znači da će u 99,72 slučajeva od 100 merenja greška merenja svakog pojedinačnog merenja biti manja od ±3σ, ili drugim rečima verovatnoća da će prava vrednost ući u interval od ( x ± 3σ) skoro da je stopostotna i iznosi 99,72 %.

Standardna devijacija utiče na širinu zvona Gausove krive, veća standardna devijacija znači da su tokom merenja slučajne greške bile velike, ili da su odstupanja od srednje vrednosti velika. Ako se pretpostavi da je x = 5 i ako se uzme da su vrednosti za σ: 1, 2 i 3, a kako je površina ispod krive jednaka jedinici, to krive za različite vrednosti σ imaju oblik kao što je to prikazano na slici 11.

Slika 11. Efekat standardne devijacije (σ) na izgled Gausove krive

2.2.9. Studentova ili t raspodela U poglavlju 2.1.2. Populacija, uzorak, proba i oprobavanje objašnjena je razlika između populacije i uzorka. Onda kada se radi sa velikim brojem proba ili sa velikim brojem analitičkih rezultat koristi se uobičajeni izraz za standardnu devijaciju (σ) koji se bazira na normalnoj raspodeli koja se opisuje Gausovom funkcijom za normalnu raspodelu. Na žalost, nije uvek moguće načiniti tako veliki broj merenja ili sakupiti tako veliki broj proba da bi se sa veoma visokom pouzdanošću dati uzorak (set proba ili set merenja) izjednačio sa populacijom. Još iz to, pokazalo se da statistika koja se odnosi na populaciju daje neke druge rezultate od statistike za dati uzorak koji vodi poreklo iz te populacije. Te su razlike bile utoliko veće ukoliko je broj proba ili merenja bio manji. Uzrok tome bila je smanjena reprezentativnost broja merenja ili proba za datu populaciju, a to je naravno imalo za posledicu da su slučajne greške odstupale od zakonitosti normalne raspodele i u takvim slučajevima se povinovale nekoj drugoj verovatnoći koja se naziva Studentova ili t raspodela, a ne normalna raspodela. Suština t raspodele je ta što se kod malog broja merenja ili za mali broj proba distribucija greške širila više lateralno i nagomilavala se na marginama krive raspodele (vidi krive na slici 12 a). Pored toga Studentova raspodela se razlikuje za veoma mali broj merenja od relativno

Ivan Gržetić, HF 14

Page 15: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

velikog i približavala se po svojim karakteristikama normalnoj raspodeli sa porastom broja merenja, odnosno proba (krive na slikama 12 a - f).

(a) (b)

(d) (e)

(f) (g)

Slika 12. Uporedna analiza Studentove (t) raspodele i normalne (n) raspodele Iskustva su pokazala da se sa brojem od trideset merenja ili proba postiže izjednačenost statističkih podataka pri Studentovoj i normalnoj raspodeli. Standardna devijacija se iskazuje u jedinicama u kojima su vršena merenja, ali može i da se pretvori u jedinice koje opisuju umnožak od σ. To se izračunava na sldeći način:

σ)( xxk i −=

gde su: ( xi - x ) odstupanja (devijacija) za i-to merenje, σ standardna devijacija pojedinačnog merenja. Kako su vrednosti za ( xi - x ) i za σ u jedinicama u kojima je vršeno merenje, to je količnik k neimenovan broj. U slučaju da je potrebno odrediti koji je to interval levo i desno od srednje vrednosti koji će obuhvatiti 95 % svih merenja onda posle složenog matematičkog postupka proizilaze vrednosti za k koje množe σ (k*σ), a koje se vide na slikama 12 a – f i koje su prepoznatljive za normalnu raspodelu jer uvek definišu interval od ± 1,96 σ. To isto znači da će samo 5 % merenja imati grešku veću od ± 1,96 σ. Kod studentove raspodele umnožak k zavisi od broja merenja ili proba. Tako, na primer, za tri merenja u Studentovoj raspodeli interval od ± 3,19 σ garantuje da će se u njemu naći 95 % svih merenja, za pet merenja 95 % interval pouzdanosti iznosi ± 2,27 σ, a za trideset merenja ± 2,05 σ što se znatno približilo vrednosti za normalnu raspodelu.

Ivan Gržetić, HF 15

Page 16: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Pojednostavljenim jezikom može se tumačiti da set sa malim brojem merenja ili proba, do pet, poseduje visok stepen verovatnoće da sva ta merenja imaju velika odstupanja, odnosno da imaju veliku grešku. Sa porastom broja merenja (proba), od pet pa naviše, verovatnoća pojavljivanja velike greške bitno opada (slika 13), odnosno raste verovatnoća da se dobijena srednja vrednost značajnije približi pravoj vrednosti.

Slika 13. Relativna greška

∆ 100*

AA u

funkciji od broja merenja N.

U tabeli 1 date su kritične vrednosti za k koje opisuju koliko standardnih devijacija (σ) levo i desno od srednje vrednosti treba da bude širok interval da bi obuhvatio određen procenat od ukupnog broja merenja, odnosno kolika je korespondentna verovatnoća pojavljivanja greške koja je veća od kritične vrednosti. Na slici 14 e (kao i na slikama 12 a – f) odabrana verovatnoća pojavljivanja greške (p) iznosi 0,05, a kritične vrednosti k (umnožak uz σ) za svaki broj merenja (nazvan još stepen slobode ili df) dat je u tabeli 1. To znači, ako je cilj da je verovatnoća pojavljivanja velike greške što manja, odnosno da je kritična vrednost k što manja, onda broj merenja mora da bude veliki. Na primer, ako je urađeno 100 merenja, onda 50 % tih merenja ima grešku veću od 0,68 σ, 5 % tih merenja ima grešku veću od 1,98 σ, odnosno 1 % tih merenja ima grešku veću od 2,62 σ. Kako je ovo ustanovljeno: u tabeli 1 se prvo pronađe red koji odgovara broju merenja, zatim se odabere kolona sa verovatnoćom pojavljivanja greške (izražena u intervalu od 0 do 1 koja se množi sa 100 da bi se dobili procenti) i to je sve. Ukoliko je broj merenja veliki tada može da se izračuna koliki je interval izražen u k*σ koji pouzdano obuhvata 50 % ... 99 % merenja od ukupnog broja merenja (∆N/N). Vrednosti za beskonačan broj merenja mogu se naći u tabeli 1, a ilustracije za pojedine procentne vrednosti na slikama 14 a – f . Ukoliko je broj merenja manji u tabeli 1 mogu se naći kritične vrednosti za k koje korespondiraju broju merenja i procentu pouzdanosti koji se zahteva.

Slika 14 a. Interval koji će obuhvatiti 50 % Slika 14 b. Interval koji će obuhvatiti 80 %

Ivan Gržetić, HF 16

Page 17: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

svih merenja. svih merenja.

Slika 14 c. Interval koji će obuhvatiti 90 %

svih merenja. Slika 14 d. Interval koji će obuhvatiti 95 %

svih merenja.

Slika 14 e. Interval koji će pouzdano

obuhvatiti 95 % svih merenja. Ostaje 5 % (2,5% + 2,5%) merenja koji će imati grešku

veću od ± 1,96 σ.

Slika 14 f. Interval koji će obuhvatiti 99 % svih merenja.

Tabela 1. Kritične vrednosti (k) za Studentovu simetričnu raspodelu greške

Traženi procenat pouzdanosti 50 % 60 % 70 % 80 % 90 % 95 % 96 % 98 % 99 %

Verovatnoća pojavljivanja greške 0,5 0,4 0,3 0,2 0,1 0,05 0,04 0,02 0,01

Br. merenja (N) 1 1,000 1,376 1,963 3,078 6,314 12,71 15,89 31,82 63,66 2 0,816 1,061 1,386 1,886 2,920 4,303 4,849 6,965 9,925 3 0,765 0,978 1,250 1,638 2,353 3,182 3,482 4,541 5,841 4 0,741 0,941 1,190 1,533 2,132 2,776 2,999 3,747 4,604 5 0,727 0,920 1,156 1,476 2,015 2,571 2,757 3,365 4,032 6 0,718 0,906 1,134 1,440 1,943 2,447 2,612 3,143 3,707 7 0,711 0,896 1,119 1,415 1,895 2,365 2,517 2,998 3,499 8 0,706 0,889 1,108 1,397 1,860 2,306 2,449 2,896 3,355 9 ,703 0,883 1,100 1,383 1,833 2,262 2,398 2,821 3,250

Ivan Gržetić, HF 17

Page 18: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Traženi procenat pouzdanosti 50 % 60 % 70 % 80 % 90 % 95 % 96 % 98 % 99 %

Verovatnoća pojavljivanja greške 0,5 0,4 0,3 0,2 0,1 0,05 0,04 0,02 0,01

Br. merenja (N) 10 0,700 0,879 1,093 1,372 1,812 2,228 2,359 2,764 3,169 11 0,697 0,876 1,088 1,363 1,796 2,201 2,328 2,718 3,106 12 0,695 0,873 1,083 1,356 1,782 2,179 2,303 2,681 3,055 13 0,694 0,870 1,079 1,350 1,771 2,160 2,282 2,650 3,012 14 0,692 0,868 1,076 1,345 1,761 2,145 2,264 2,624 2,977 15 0,691 0,866 1,074 1,341 1,753 2,131 2,249 2,602 2,947 16 0,690 0,865 1,071 1,337 1,746 2,120 2,235 2,583 2,921 17 0,689 0,863 1,069 1,333 1,740 2,110 2,224 2,567 2,898 18 0,688 0,862 1,067 1,330 1,734 2,101 2,214 2,552 2,878 19 0,688 0,861 1,066 1,328 1,729 2,093 2,205 2,539 2,861 20 0,687 0,860 1,064 1,325 1,725 2,086 2,197 2,528 2,845 21 0,663 0,859 1,063 1,323 1,721 2,080 2,189 2,518 2,831 22 0,686 0,858 1,061 1,321 1,717 2,074 2,183 2,508 2,819 23 0,685 0,858 1,060 1,319 1,714 2,069 2,177 2,500 2,807 24 0,685 0,857 1,059 1,318 1,711 2,064 2,172 2,492 2,797 25 0,684 0,856 1,058 1,316 1,708 2,060 2,167 2,485 2,787 26 0,684 0,856 1,058 1,315 1,706 2,056 2,162 2,479 2,779 27 0,684 0,855 1,057 1,314 1,703 2,052 2,15 2,473 2,771 28 0,683 0,855 1,056 1,313 1,701 2,048 2,154 2,467 2,763 29 0,683 0,854 1,055 1,311 1,699 2,045 2,150 2,462 2,756 30 0,683 0,854 1,055 1,310 1,697 2,042 2,147 2,457 2,750 40 0,681 0,851 1,050 1,303 1,684 2,021 2,123 2,423 2,704 50 0,679 0,849 1,047 1,295 1,676 2,009 2,109 2,403 2,678 60 0,679 0,848 1,045 1,296 1,671 2,000 2,099 2,390 2,660 80 0,678 0,846 1,043 1,292 1,664 1,990 2,088 2,374 2,639

100 0,677 0,845 1,042 1,290 1,660 1,984 2,081 2,364 2,626 1000 0,675 0,842 1,037 1,282 1,646 1,962 2,056 2,330 2,581 ∞ 0,674 0,841 1,036 1,282 1,645 1,960 2,054 2,326 2,576

2.2.10. Uticaj broja merenja na standardnu devijaciju pojedinačnog merenja

Koristeći se iskustvima iz Studentove raspodele ustanovljeno je da je za broj merenja (ili proba) manji od 30 mnogo bolje koristiti posebnu formulu za standardnu devijaciju koja se dobro uklapa u Studentovu raspodelu, a koja glasi:

1

)(1

2

−=∑=

N

xxs

N

ii

gde su: s standardna devijacija pojedinačnog merenja za mali broj merenja ili proba, (xi - x ) devijacija pojedinačnih merenja i, (N-1) broj merenja ili proba umanjen za jedan.

Ivan Gržetić, HF 18

Page 19: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Studentova raspodela govori o raspodeli greške, a standardna devijacija uzorka (s) o njenoj veličini. To znači da pri prikazivanju intervala poverenja za neki set merenja treba koristiti u tabeli 1 onaj red koji odgovara stvarnom broju merenja (N), a standardnu devijaciju izračunavati sa (N-1).

2.2.11. Standardna devijacija srednje vrednosti

Kada se neka populacija uzorkuje u više navrata, pri čemu svaku uzorak predstavlja set od više merenja tada svaki set ima svoju srednju vrednost. Te srednje vrednosti nisu međusobni jednake. Što je veći broj uzoraka (setova merenja) to će se ove srednje vrednosti distribuirati oko prave vrednosti u skladu sa zakonitostima po kojima se distribuiraju sva pojedinačna merenja oko svojih srednjih vrednosti. Svođenjem složenog matematičkog postupka standardna devijacija srednje vrednosti (ssv) može se predstaviti vrlo jednostavnom formulom:

Standardna devijacija srednje vrednosti = Ns

Nsssv ==

2

gde su: s2 varijansa, s standardna devijacija pojedinačnog merenja, a N broj merenja u datom setu. Kako se vidi ova formula omogućava da se odredi standardna devijacija srednje vrednosti za svaki pojedinačni set.

2.2.12. Značajnost merenja Pojam značajnosti merenja, ili statistička signifikantnosti, povezuje se sa verovatnoćom pojavljivanja greške, odnosno sa pouzdanošću. Za merenja koja imaju procenat pouzdanosti od 95% kaže se da se nalaze na granici značajnosti. To znači da sva merenja koja imaju manju vrednost od 95% pouzdanosti spadaju u malo značajna ili statistički nesignifikantna merenja. Merenja koja imaju procenat pouzdanosti veći od 99% spadaju u visoko značajna ili visoko signifikantna merenja. Generalno gvororeći rezultat merenja je utoliko statistički signifikantniju (značajniji) ukoliko je bliži srednjoj tj, pravoj vrednosti.

2.2.13. Test normalnosti Da li neki set merenja zaista spada u grupu merenja sa normalnom raspodelom ili ne, odnosno spada li u grupu merenja sa nesimetričnom (nenormalnom) raspodelom posebno je važno utvrditi, pogotovu što se kod setova sa deformisanom raspodelom ne može koristiti uobičajeni statistički pristup. Ovaj test se uvek primenjuje kada se posumnja da su statistički podaci nepouzdani, kada mogu da navedu na pogrešno zaključivanje, odnosno kada je očigledno da ispitivani set nema normalnu raspodelu. Test normalnosti se izvodi tako što se na bazi Gusove raspodele određuje da li će 68,26 % merenja ući u interval od ( x ± σ). To bi značilo da će u 68,26 slučajeva od 100 merenja greška merenja svakog pojedinačnog merenja biti manja od ±σ. Odnosno, da li će 95,44 % merenja ući u interval od ( x ± 2σ), a to bi značilo da će u 95,44 slučajeva od 100 merenja greška merenja svakog pojedinačnog merenja biti manja od ±2σ. Ukoliko ispitivani set merenja zadovolji ove uslove smatra se da pripada setu merenja sa normalnom raspodelom. U slučaju da dati set ne ispuni ove uslove moguć je alternativni pristup:

1. Povećava se broj merenja za dati set, ako je to moguće. Obično ovo ima za posledicu da se dati set postepeno transformiše u set sa normalnom raspodelom.

Ivan Gržetić, HF 19

Page 20: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

2. Primenjuju se druge statističke metode za određivanje statističkih parametara koje su karakteristične za nesimetrične ili deformisane raspodele.

2.2.14. Odbacivanje merenja sa velikom greškom

Postoje dva načina da se odbace merenja sa velikom greškom. Prvi je onaj koji se odnosi na direktno prepoznavanje neuobičajene vrednosti u laboratoriji i koji zahteva da se proba koja je dala datu vrednost ponovo pripremi i meri ili da se jednostavno merenje ponovi. Drugi način se odnosi na korišćenje robustnih statističkih metoda. Kako će se statistički prepoznati merenje sa velikom greškom? Postoje dve proste metode da sa ovakva merenja prepoznaju, a to su: test z rezultata i modifikovani test z rezultata. Test z rezultata se zasniva na sledećoj formuli:

sxx

z vg || −=

gde su: | xvg - x | apsolutna devijacija pojedinačnog merenja sa velikom greškom (xvg), a s standardna devijacija za dati set merenja koji obuhvata sva merenja. Ukoliko je apsolutna devijacija pojedinačnog merenja sa velikom greškom tri puta veća od standardne devijacije (z > 3) onda se dato merenje odbacuje. Test z rezultata, iako korišćen, ima svoje mane jer standardna devijacija obuhvata i merenje sa velikom greškom koje ujedno utiče i na z rezultat. Modifikovani test z rezultat ne podleže uticaju merenja sa velikom greškom i zato je pouzdaniji. Ovde se koristi medijana apsolutnih devijacija (MAD):

MAD = Medijana {| xi - x |} gde su: | xi - x | apsolutna vrednost devijacije (odstupanja) za i-to merenje, {| xi - x |} skup svih apsolutnih vrednosti pojedinačnih devijacija (odstupanja za sva merenja). Kada se napravi skup svih apsolutnih vrednosti i kada se te vrednosti poređaju po veličini, tada se za taj skup pronađe medijana prema već poznatom postupku. Modifikovani test z rezultata se zasniva na sledećoj formuli:

MADxx

z vgm

|| −=

Ukoliko je apsolutna vrednost devijacije merenja sa velikom greškom (xvg) tri i po puta veće od MAD ( zm > 3,5) tada se to merenje odbacuje.

2.2.15. Greške koje nastaju zbog rezultata koji su ispod detekcijonog limita

Upotreba vrednosti merenja koja su objektivno ispod detekcionog limita (DL) neke metode značajno može da utiče na konačne rezultate, a posebno su opasne kod komaparacije podataka ili seta podataka, pa zato oko njih mora da se postigne poseban dogovor. Postoji u principu pet različitih načina za postupanje sa ovakvim podacima, mada se ni jedan od njih ne može favorizovati:

1. Izmerena vrednost se uzima u razmatranja iako je nepouzdana. Ovaj način se primenjuje samo u posebnim slučajevima, kada nema drugog izbora i kada analitičar iskustveno proceni da je ovaj način prihvatljiv, dakle kada ne postoje uslovi za bilo koji drugi pristup, na primer, merenja osetljivijom metodom.

Ivan Gržetić, HF 20

Page 21: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

2. Numerička vrednost za detekcijoni limit1 se koristi umesto dobijene vrednosti i prikazuje se kao < DL (manje od DL). U ovakvim slučajevima postoji opasnost da se ovakvi rezultati precene u daljim razmatranjima, čime se znatno uvećava nepoznata realna vrednost. Kako se ovakva merenja uzimaju u obzir ona utiču na srednju vrednost i standardnu devijaciju.

3. Polovina vrednosti za detekcioni limit se koristi umesto dobijene vrednosti ukoliko se ne raspolaže sa nekom drugom vrednošću koja je ustanovljena nekom drugom metodom.

4. Izračunava se procenjena vrednost na bazi sledeće formule: Procenjena vrednosat = (100%-A)* DL, gde je: A – procenat broja merenja od ukubnog broja merenja koja se nalaze ispod DL. Ako je, na primer, 6 merenja od ukupno 20 merenja ispod DL, tada je Procenjena vrednost = (100-30)*DL = 70% od DL.

5. Umesto dobijene vrednosti stavlja se nula. U ovakvim slučajevima postoji opasnost da se ovakavi rezultati podcene u daljim razmatranjima, čime se znatno umanjuje nepoznata realna vrednost. Kako se ovakva merenja uzimaju u obzir ona utiču na srednju vrednost i na standardnu devijaciju.

2.2.16. Jedan konkretan primer

Set od pet laboratoriskih merenja, koja se odnose na sadržaj Fe u sfaleritu (ZnS), neophodno je statistički obraditi. Sadržaj je iskazan arbitražnim jedinicama. Statistička obrada je izvršena prema opisu i preporukama teksta koji prethodi, a rezultati su izloženi u tabeli 2.

Tabela 2. Sumarna tabela statističkih vrednosti za set od 5 merenja iskazanih u arbitražnim jedinicama

Br. merenja Rezultatimerenja

Uredjena merenja | xi - x | (xi - x )2 z zm

1 2,98 2,98 1,14 1,30 0,71 1,422 3,42 3,32 0,80 0,64 0,50 1,003 3,32 3,42 0,70 0,49 0,43 0,884 3,94 3,94 0,18 0,03 0,11 0,235 6,95 6,95 2,83 7,99 1,75 3,53 Σ 20,61 20,61 5,66 10,47 x 4,12 δ 1,13 M 3,42 0,80 s 1,62 σ 1,45 ssv 0,72

Varijansa (s2) 2,62 Varijansa (σ2) 2,09

1 Treba razlikovati DL metode od DL za dati supstrat. DL metode se određuje pri idealnim uslovima kada ne postoje nikakve smetnje u određivanju DL od strane nečistoća, lošeg rastvarača ili sličnog. DL za dati supstrat je realna vrednost za datu metodu i za dati suptrat jer obuhvata i sve moguće smetnje koje proizilaze zbog rastvarača, interferenci, nečistoča itd. To znači da je DL za dati supstrat najrealnija vrednost koju treba koristiti kad god je to moguće.

Ivan Gržetić, HF 21

Page 22: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Dobijena merenja pokazuju da je sadržaj Fe neujednačen i da je jedno od merenja (6,95) suviše veliko i da se ne uklapa u dati set. Iskustvo je pokazalo da Fe u sfaleritu može da bude nehomogeno raspoređeno, ali ovako velike fluktuacije nisu poznate, dakle, treba odrediti da li je ovo merenje za odbacivanje. Broj merenja je mali, svega pet i znatno je manj od 30, dakle, statistika će se raditi prema t raspodeli, a ne prema normalnoj raspodeli. Iz tabele 2 koristiće se samo osenčene vrednosti jer one predstavljaju rezultate koji su validni i baziraju se na Studentovoj raspodeli.

• Srednja vrednost ( x ) iznosi: 4,12. • Standardna devijacija (s) za uzorak od 5 merenja iznosi: 1,62. • Standardna devijacija srednje vrednosti (ssv): 0,72. • Varijansa (s2) za uzorak od 5 merenja iznosi: 2,62.

Analizirajući date vrednosti može se zaključiti da su prve 4 vrednosti prihvatljive, a da je peta, na bazi modifikovanog testa z rezultata za odbacivanje jer je za to merenje zm > 3,5. Pošto je peto merenje odbačeno neophodno je uraditi novu statističku obradu preostalih četiri merenja (tabela 3).

Tabela 3. Sumarna tabela statističkih vrednosti za set od 4 merenja iskazanih u arbitražnim jedinicama

Br, merenja Rezultatimerenja

Uredjena merenja | xi - x | (xi - x )2 z zm

1 2,98 2,98 0,44 0,19 1,09 1,642 3,42 3,32 0,10 0,01 0,24 0,363 3,32 3,42 0,01 0,00 0,01 0,024 3,94 3,94 0,53 0,28 1,32 1,98 Σ 13,66 13,66 1,08 0,48 x 3,42 δ 0,27 M 3,37 0,27 s 0,40 σ 0,34 ssv 0,20

Varijansa (s2) 0,16 Varijansa (σ2) 0,12

Iz tabele 3 koristiće se samo osenčene vrednosti jer one predstavljaju rezultate koji su validni i baziraju se na Studentovoj raspodeli.

• Srednja vrednost ( x ) iznosi: 3,42. • Standardna devijacija (s) za uzorak od 4 merenja iznosi: 0,40. • Standardna devijacija srednje vrednosti (ssv): 0,20. • Varijansa (s2) za uzorak od 5 merenja iznosi: 0,16.

Kako Studentova raspodela ne koristi σ, već s vrednosti, to će se u tabeli 4 analiza greške raditi sa k*s a ne sa k* σ.

Tabela 4. Sumarna tabela analize greške za set merenja obrađen u tabeli 3. OSNOVNI PODACI Stepen pouzdanosti 50 Stepen pouzdanosti 95 Stepen pouzdanosti 99

Ivan Gržetić, HF 22

Page 23: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

% % % N = 4 x = 3,42

s = 0,40 k (iz tabele 1) 0,741 2,776 4,604

x ± k*s 3,42 ± 0,30 3,42 ± 1,11 3,42 ± 1,84 Interval za k*s Od 3,12 do 3,72 Od 2,31 do 4,52 Od 1,58 do 5,26

ssv = 0,20 Šta govore podaci iz tabele 4. • Prvo, ako se želi da ustanovi stepen pouzdanosti od svega 50 % onda srednja vrednost

3,42 u intervalu od 3,12 do 3,72 garantuje da će samo 50 % mernih vrednosti pripadati tom intervalu, odnosno da postoje još uvek neke druge vrednosti koje su veće ili manje od srednje vrednosti, ali koje ne ulaze u dati interval. Za stepen pouzdanosti od 95 % taj interval je znatno širi, od 2,31 do 4,52, a to znači da je sigurnost zamene prave vrednosti srednjom vrednošču relativno mala, dakle, pojava greške u samoj srednjoj vrednosti je vrlo verovatna, standardna devijacija srednje vrednosti to govori jer iznosi 0,20 arbitražnih jedinica.

• Drugo, mali broj merenja (svega 4 prihvatljiva merenja) na bazi Studentove raspodele ima po pravilu lošu statistiku. Evo dokaza, da je data srednja vrednost posledica 100 merenja, tada bi za stepen pouzdanosti od 95 % interval oko srednje vrednosti bio ±1,984s, a ne sadašnjih ±4,604s.

2.2.17. Grafičko prikazivanje rezultata

Pitanje prikazivanja rezultat merenja jeste uvek otvoreno i ne može se univerzalno rešiti jer svaki istraživač može da ima svoje specifične zahteve po pitanju grafičkog predstavljanja merenja i odgovarajuće statistike. U principu za grafičko predstavljanje bitne su sledeće veličine: pojedinačne vrednosti, srednja vrednost, medijana, kvartili, standardna devijacija pojedinačnog merenja i standardna devijacije srednje vrednosti, minimalna i maksimalna vrednost, itd. Obično se statističke vrednosti crtaju sa tačkama, «kućicama» i graničnicima kako je to prikazano na slici 15. Vrednosti ispod i iznad graničnika i ne moraju da se crtaju. Naravno, ovo nije jedini način prikaza rezultat. Posebno je važno sagledati kako su postavljene vrednosti za «kućicu» koja definiše uži interval verovatnoće pojavljivanja mernih vrednosti. Prve dve naspramne stranice kućice mogu biti definisane, na primer, kvartilima (nedajte se zbuniti, druge dve naspramne strane kućice nemaju nikakvo značenje), a graničnici nekim drugim vrednostima koje definišu širi interval, na primer, minimalna i makslana vrednost.

Simetrična (normalna raspodela) Nesimetrična (deformisana) raspodela

Ivan Gržetić, HF 23

Page 24: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Merene vrednosti: 1, 4, 9, 12, 16, 23, 24 x = 12,7 M = 12 S = 8,9

Ssv = 4,8 x + S = 12,7 + 8,9 = 21,6 x - S = 12,7 - 8,9 = 3,8

Prikaz minimalne i maksimalne vrednosti sa

srednjom vrednošću

Prikaz srednje vrednosti sa standardnom devijacijom

Interkvartilni raspon (IKR) = interval koji obuhvata 50% svih merenja (razlika između

III i I kvartila)

Slika 15. Grafički prikaz rezultata i korespondentne greške 3. VARIJANSA Varijansa je prosto mera koja opisuje koliko su neka merenja rasejana oko srednje vrednosti. Ako su sva merenja u jednom setu tesno okupljena oko srednje vrednosti, znači da imaju male devijacije, tada će varijansa biti mala (slike 16, 17 i 18). Nasuprot tome, ako su merenja dosta udaljena od srednje vrednosti tj, ako su devijacije velike, onda je i varijansa velika.

Slika 16. Ako su sva merenja u jednom setu tesno

okupljena oko srednje vrednosti, znači da imaju male devijacije, tada će

varijansa biti mala.

Slika 17. Ako su sva merenja u jednom setu

rasejana, znači da imaju velike devijacije, onda je i

varijansa velika.

Slika 18. Velika i mala varijansa za dva seta

merenja

Varijansa se izračunava kao srednja vrednost kvadratne devijacije svakog merenja u odnosu na srednju vrednost seta merenja. Varijansa za veoma veliki broj merenja se izražava matematički kao σ2 za šta se koristi sledeća formula:

Ivan Gržetić, HF 24

Page 25: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Varijansa populacije = N

xxN

ii∑

=

−= 12

)(σ

gde su: (xi - x )2 kvadrat devijacije svakog merenja , xi merena vrednost, x srednja vrednost, a N broj merenja. Ukoliko je broj merenja u jednom setu merenja manji od 30 tada se koristi sledeći izraz za varijansu:

Varijansa uzorka = 1

)(12

−=∑=

N

xxs

N

ii

3.1. ANALIZA VARIJANSE

Analiza varijanse se popularno obeležava u stručnim krugovima akronimom ANOVA koji vodi poreklo od engleskog naziva «ANalysis Of VAriance». Postoji mnogo formi analize varijanse među kojima su:

• Jesdnosmerna analiza varijanse za nezavisne vrednosti, • Jesdnosmerna analiza varijanse za zavisne vrednosti, • Dvosmerna analiza varijase, • Višestruka naliza varijanse, • Višestruka analiza varijanse (MANOVA), • Analiza kovarijase (ANCOVA), itd.

Neke od ovih formi analize varijansi su vrlo složene i zato će se u ovom tekstu obraditi samo najprostija ANOVA: jesdnosmerna analiza varijanse za nezavisne vrednosti.

3.1.1. Jednosmerna analaiza varijanse za nezavisne vrednosti Jesdnosmerna analiza varijanse za nezavisne vrednosti koristi se u onim situacijama kada se ispituju i upoređuje više od dve grupe proba, odnosno više od dva seta merenja. U principu broj grupa i ili setova merenja može biti prilično veliki. Za svaku grupu (set) rezultata koji su međusobno nezavisni, to znači da ni jedan rezultat iz jedne grupe nije u funkcionalnoj zavisnosti od rezultata iz druge, potrebno je odrediti sve deskriptivne statističke parametre među kojima je najvažnija standardna devijacije (s) urađene na bazi t-raspodele. Analiza varijanse se danas radi uz pomoć računara. Da bi se, međutim, shvatio celokupni postupak ovde će biti pobrojane potrebne formule za analizu varijanse koje su duge i komplikovane. Radi lakšeg razumevanja celokupni postupak će se podeliti u niz malih koraka:

A. Generisanje matrice, B. Zbir kvadrata pojedinačnih vrednosti, C. Kvadrat zbira pojedinačnih vrednosti podeljena sa brojem elemenata matrice, D. Kvadrat grupnog zbira podeljena sa brojem elemenata grupe, E. Zbir kvadrata između grupa (ZKIG), F. Zbir kvadrata unutar grupe (ZKUG), G. Ukupni zbir kvadrata (UZK), H. Srednji kvadrat između grupa (SKIG), I. Srednji kvadrat unutar grupa (SKUG), i J. F količnik.

Ivan Gržetić, HF 25

Page 26: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

U suštini F količnik je parametar koji opisuje odnos srednjih kvadrata između grupa i unutar grupe i koji otkriva odnos variajse među grupama i varijanse u grupama. A. Matrica podataka: Kako je već rečeno polazi se od nekoliko grupa ili setova podataka pri čemu svaku set (grupa) ima svoje elemente (podatke) koje sve zajedno treba prikazati u okviru jedne zajedničke matrice (osenčen deo u tabeli 5) u kojoj će se svaka grupa indeksirati sa j, a svaki element grupe indeksirati sa i. Koristeći indekse zaista je moguće sakupiti sve podatke u zajedničku matricu, a da se podaci ne pomešaju, s obzirom da se označavaju sa xij, to znači da svaki element matrice ima tačno definisano mesto popitanju položaja u grupi i po pitanju grupe. Da bi objašnjenja bila razumljivija svim elementima matrice biće dodeljene neke vrednosti.

Tabela 5. Matrica više grupa podataka (osenčeni deo) Indeksi i i j I grupa (j = 1) II grupa (j = 2) III grupa (j = 3)

i = 1 X11 = 3 X12 = 2 X13 = 5

i = 2 X21 = 4 X22 = 3 X23 = 7

i = 3 X31 = 5 X32 = 4 X33 = 6

i = 4 X41 = 6 X42 = 2 X43 = 4

i = 5 X51 = 4 X52 = 0 X53 = 5

i = 6 X61 = 3 X62 = 2 X63 = 6

i = 7 X71 = 2 X72 = 3 X73 = 5 i = 8 X81 = 5 X82 = 2 X83 = 4 i = 9 X92 = 1 X93 = 3

i = 10 X102 = 1 Deskriptivni statistički podaci koji se baziraju na elementima iz tabele 5 dari su tabeli 6.

Tabela 6. Deskriptivni statistički podaci za tabelu 5 I grupa (j = 1) II grupa (j = 2) III grupa (j = 3) x 4,00 2,00 5,00

Σ (xi - x )2 12,00 12,00 12,00 Σxi 32 20 45 Σx2

i 144 48 237 s 1,309 1,155 1,225 s2 1,714 1,333 1,500

Srednja vrednost za celu matricu iznosi x = 3,59. Standardna devijacija za celu matricu iznosi s = 1,760. Varijansa za celu matricu iznosi s2 = 3,097. Kako se vidi u ovom primeru standardna devijacija za celu matricu je veća od bilo koje standardne devijacije po grupama kao što je i varijansa za matricu veća od bilo koje varijanse po grupama. Bez svake sumnje parametri za celu matricu ne odražavaju srednje vrednosti za pojedinačne grupe, nameće se zaključak da je neophodna statistička obrada podataka između grupa na prikladniji način, a to upravo radi analiza varijanse. B. Zbir kvadrata pojedinačnih vrednosti: Svaki elemenat matrice treba kvadrirati i sve to zajedno sabrati prema sledećoj formuli:

Ivan Gržetić, HF 26

Page 27: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Zbir kvadrata pojedinačnih vrednosti = ∑∑i j

ijx2

Pojedinačne vrednosti nalaze se u matrici pa će se dobiti sledeće: ∑∑

i jijx2 = 32+ 42 +52 +62 +...+ 52 +42 +32 = 429

C. Kvadrat zbira pojedinačnih vrednosti podeljena sa brojem elemenata matrice: Ovde prvo treba sve elemente iz matrice sabrati i potom dobijeni rezultat kvadrirati. Zatim drugo što treba uraditi je da se dobijeni rezultat podeli sa brojem elemenata matrice. Broj elemenata matrice (N) se lako dobija sabiranjem elemenata svakog seta (N = Σnj).

Kvadrat zbira pojedinačnih vrednosti = 2

∑∑

i jijx

Pojedinačne vrednosti nalaze se u matici pa će se dobiti sledeće:

2

∑∑

i jijx = 3 + 4 + 5 + 6 +...+ 5 + 4 + 3 = 972 = 9409

U prvom setu ima 8, u drugom 10, a u trećem 9 elemnata, to ukupno čini 27, pa je:

Kvadrat zbira pojedinačnih vrednosti podeljena sa brojem elemenata matrice = N

xi j

ij

2

∑∑

N

xi j

ij

2

∑∑

= 27

9409 = 348,481

D. Kvadrat grupnog zbira podeljena sa brojem elemenata grupe: U ovom koraku se načine sume pojedinačnih vrednosti za svaki set (grupu), a zatim se taj zbir kvadrira, a potom deli sa brojem elemenata grupe (n). To se radi prema sledećoj formuli:

Kvadrat grupnog zbira podeljena sa brojem elemenata grupe = ∑∑

j j

iij

n

x2

.

∑∑

j j

iij

n

x2

= 9

451020

832 222

++ = 128 + 40 + 225 = 393

Za jednosmernu analizu varijanse značajna su tri zbira koji će se dobiti kombinovanjem prethodne tri jednačine koje su opisane u koracima B, C i D, a to su:

Ivan Gržetić, HF 27

Page 28: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

E. Ukupni zbir kvadrata (UZK) (jednačina iz koraka B – jednačina iz koraka C). F. Zbir kvadrata između grupa (ZKIG) (jednačina iz koraka D – jednačina iz koraka C); G. Zbir kvadrata unutar grupe (ZKUG) (jednačina iz koraka B – jednačina iz koraka D);

Ovde treba imati u vidu da se Zbir kvadrata unutar grupe (ZKUG) dobija kao razlika između ukupnog zbira kvadrata (UZK) i zbira kvadrata između grupa (ZKIG) što daje konačan izraz opisan kao: jednačina iz koraka B – jednačina iz koraka D. E. Ukupni zbir kvadrata (UZK): Ova vrednost se dobija iz razlike sume kvadrata pojedinačnih vrednosti i kvadrat sume pojedinačnih vrednosti podeljena sa brojem elemenata matrice (jednačina iz koraka B – jednačina iz koraka C):

USK = ∑∑i j

ijx2 - N

xi j

ij

2

∑∑

USK = 429 - 27972

= 429 – 348,481 = 80,519.

F. Zbir kvadrata između grupa (ZKIG): Ova vrednost se dobija iz razlike kvadrata grupnog zbira podeljena sa brojem elemenata grupe i kvadrata sume pojedinačnih vrednosti podeljena sa brojem elemenata matrice (jednačina iz koraka D – jednačina iz koraka C):

ZKIG =∑∑

j j

iij

n

x2

- N

xi j

ij

2

∑∑

ZKIG = 393 - 27972

= 393 – 348,481 = 44,519.

G. Zbir kvadrata unutar grupe (ZKUG): Ova vrednost se dobija iz razlike sume kvadrata pojedinačnih vrednosti i kvadrat grupnog zbira podeljena sa brojem elemenata grupe (jednačina iz koraka B – jednačina iz koraka D):

ZKUG = UZK – ZKIG

ZKUG = ∑∑i j

ijx2 - ∑∑

j j

iij

n

x2

ZKUG = 80,519 – 44,519 = 36.

ili ZKUG = 429 – 393 = 36.

Ivan Gržetić, HF 28

Page 29: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Prethodne dve vrednosti: zbir kvadrata između grupa (ZKIG) i zbir kvadrata unutar grupe (ZKUG) su značajne za F količnik, ali ih treba još «doraditi» i to sa brojem elemenata matrice i brojem grupa. Broj elemenata matrice (N): Lako se dobija sabiranjem elemenata svake grupe (N = Σnj), za prvu grupu (j = 1) n1 = 8, za drugu grupu (j = 2) n2 = 10 i za treću grupu (j = 3) n3 = 9, to čini ukupno N = 27. Broj grupa (J): Ovaj broj odgovara najvećoj vrednosti indeksa j. H. Srednji kvadrat između grupa (SKIG): Ova vrednost se izračunava tako što se zbir kvadrata između grupa (ZKIG) deli sa (J-1) grupa:

SKIG = 1−J

ZKIG

SKIG = 2519,44 = 22,26

I. Srednji kvadrat unutar grupa (SKUG): Ova vrednost se izračunava tako što se zbir kvadrata unutar grupe (ZKUG) deli sa (N-1) elemenata:

SKUG = 1−N

ZKUG

SKUG = 2436 = 1,5.

J. F količnik: Ova vrednost se dobija kao količnik srednjeg kvadrata između grupa (SKIG) i srednjeg kvadrata unutar grupa (SKUG):

F = grupa unutar kvadrata Srednjeggrupa izmeđzkvadrata Srednjeg

F = SKUGSKIG

F = 5,126,22 = 14,84.

Još jednom treba napomenuti da je opisani postupak komplikovan i da za njega danas postoji niz komercijalnih računarskih programa koji sadrže celokupnu matematiku proceduru i čine analizu varijanse lakom i pristupačnom. F količnik je takva vrednost koja može da ima vrednosti od nula pa do beskonačnosti. F količnik je parametar koji otkriva odnos varijanse između srednjih vrednosti grupa i varijanse u grupama. Odnos ovih varijansi grafički je ilustrovan na slikama 19 a – d.

Ivan Gržetić, HF 29

Page 30: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

(a)

Varijansa između srednjih vrednosti: nema je Varijansa unutar grupa: velika F količnik: jako mali – nema ga

(b)

Varijansa između srednjih vrednosti: velika Varijansa unutar grupa: velika F količnik: mali

(c) Varijansa između srednjih vrednosti: velika Varijansa unutar grupa: promenljiva F količnik: osrednji

(d) Varijansa između srednjih vrednosti: velika Varijansa unutar grupa: mala F količnik: veliki

Slika 19. Uticaj varijanse unutar grupa na ukupnu varijansu. Varujanse grupa su predstavljene kao ampule, srednja vrednost za svaku grupu kao linije koje presecaju ampulu, ukupna srednja vrednost za sve grupe je predstavljena kao horizontalna linija koja preseca sliku horizontalno, ukupna varijansa se proteže od najniže vrednosti do najviše vrednosti koje dohvataju grupe. Varijansa između grupa opisuje varijaciju srednjih vrednosti grupa od jedne sveobuhvatne srednje vrednosti, dok varijansa unutar grupa predstavlja varijabilnost unutar svake grupe koja je ujedno usaglašena sa veličinom grupe. Što je F količnik veći to je verovatnije da su grupe među sobom različitije, odnosno da pripadaju različitim populacijama. Kod analize materijala (ruda) to znači da potiču od materijala (rude) različitih kvaliteta. Ako je F količnik znatno veći od jedinice to znači da postoji veća varijabilnost između grupa nego što je ona unutar grupa, a to opet znači da grupe pripadaju različitim populacijama. Što je F količnik manji to su grupe među sobom sličnije, a to znači da grupe verovatno pripadaju jednoj istoj populaciji. Kod analize materijala (ruda) to znači da potiču od materijala (rude) istog ili sličnog kvaliteta. Kako će se tačno znati koja je to kritična vrednost iznad koje F količnik poseduje visok stepen verovatnoće koja potkrepljuje tvrdnju da su grupe međusobno različitog porekla. To se može izračunati ili pronaći u tabelama za različite stepene pouzdanosti F vrednosti. U tabeli 7 date

Ivan Gržetić, HF 30

Page 31: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

su kritične vrednosti za F količnik za stepen pouzdanosti od 95% ili sa verovatnoćom pojavljivanje greške manjom od 5%. U konkretnom slučaju, za primer koji je obrađivan u tekstu, broj elemenata matrice je N = 27, a broj grupa 3, to znači da se za vrednosti F > 2,9604 može tvrditi da su grupe različitog porekla, odnosno da je F < 2,9604 onda bi grupe bile vrlo verovatno poreklom iz iste populacije. Tabela 7. Kritične vrednosti za F količnik za stepen pouzdanosti od 95% ili sa verovatnoćom

pojavljivanje greške manjom od 5% ( p < 0,05) Broj grupa j Broj

elemenata matrice N 1 2 3 4 5 6 7 8 9 10

1 161,4476 199,5000 215,7073 224,5832 230,1619 233,9860 236,7684 238,8827 240,5433 241,8817

2 18,5128 19,0000 19,1643 19,2468 19,2964 19,3295 19,3532 19,3710 19,3848 19,3959

3 10,1280 9,5521 9,2766 9,1172 9,0135 8,9406 8,8867 8,8452 8,8123 8,7855

4 7,7086 6,9443 6,5914 6,3882 6,2561 6,1631 6,0942 6,0410 5,9988 5,9644

5 6,6079 5,7861 5,4095 5,1922 5,0503 4,9503 4,8759 4,8183 4,7725 4,7351

6 5,9874 5,1433 4,7571 4,5337 4,3874 4,2839 4,2067 4,1468 4,0990 4,0600

7 5,5914 4,7374 4,3468 4,1203 3,9715 3,8660 3,7870 3,7257 3,6767 3,6365

8 5,3177 4,4590 4,0662 3,8379 3,6875 3,5806 3,5005 3,4381 3,3881 3,3472

9 5,1174 4,2565 3,8625 3,6331 3,4817 3,3738 3,2927 3,2296 3,1789 3,1373

10 4,9646 4,1028 3,7083 3,4780 3,3258 3,2172 3,1355 3,0717 3,0204 2,9782

11 4,8443 3,9823 3,5874 3,3567 3,2039 3,0946 3,0123 2,9480 2,8962 2,8536

12 4,7472 3,8853 3,4903 3,2592 3,1059 2,9961 2,9134 2,8486 2,7964 2,7534

13 4,6672 3,8056 3,4105 3,1791 3,0254 2,9153 2,8321 2,7669 2,7144 2,6710

14 4,6001 3,7389 3,3439 3,1122 2,9582 2,8477 2,7642 2,6987 2,6458 2,6022

15 4,5431 3,6823 3,2874 3,0556 2,9013 2,7905 2,7066 2,6408 2,5876 2,5437

16 4,4940 3,6337 3,2389 3,0069 2,8524 2,7413 2,6572 2,5911 2,5377 2,4935

17 4,4513 3,5915 3,1968 2,9647 2,8100 2,6987 2,6143 2,5480 2,4943 2,4499

18 4,4139 3,5546 3,1599 2,9277 2,7729 2,6613 2,5767 2,5102 2,4563 2,4117

19 4,3807 3,5219 3,1274 2,8951 2,7401 2,6283 2,5435 2,4768 2,4227 2,3779

20 4,3512 3,4928 3,0984 2,8661 2,7109 2,5990 2,5140 2,4471 2,3928 2,3479

21 4,3248 3,4668 3,0725 2,8401 2,6848 2,5727 2,4876 2,4205 2,3660 2,3210

22 4,3009 3,4434 3,0491 2,8167 2,6613 2,5491 2,4638 2,3965 2,3419 2,2967

23 4,2793 3,4221 3,0280 2,7955 2,6400 2,5277 2,4422 2,3748 2,3201 2,2747

24 4,2597 3,4028 3,0088 2,7763 2,6207 2,5082 2,4226 2,3551 2,3002 2,2547

25 4,2417 3,3852 2,9912 2,7587 2,6030 2,4904 2,4047 2,3371 2,2821 2,2365

26 4,2252 3,3690 2,9752 2,7426 2,5868 2,4741 2,3883 2,3205 2,2655 2,2197

27 4,2100 3,3541 2,9604 2,7278 2,5719 2,4591 2,3732 2,3053 2,2501 2,2043

28 4,1960 3,3404 2,9467 2,7141 2,5581 2,4453 2,3593 2,2913 2,2360 2,1900

29 4,1830 3,3277 2,9340 2,7014 2,5454 2,4324 2,3463 2,2783 2,2229 2,1768

Ivan Gržetić, HF 31

Page 32: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Broj grupa j Broj elemenata matrice N 1 2 3 4 5 6 7 8 9 10

30 4,1709 3,3158 2,9223 2,6896 2,5336 2,4205 2,3343 2,2662 2,2107 2,1646

40 4,0847 3,2317 2,8387 2,6060 2,4495 2,3359 2,2490 2,1802 2,1240 2,0772

60 4,0012 3,1504 2,7581 2,5252 2,3683 2,2541 2,1665 2,0970 2,0401 1,9926

120 3,9201 3,0718 2,6802 2,4472 2,2899 2,1750 2,0868 2,0164 1,9588 1,9105

∞ 3,8415 2,9957 2,6049 2,3719 2,2141 2,0986 2,0096 1,9384 1,8799 1,8307

4. NESIMETRIČNE ILI DEFORMISANE RASPODELE Ukoliko se za neki set merenja nedvosmisleno zaključi da ima nesimetričnu ili deformisanu raspodelu merenja onda se mora biti krajnje oprezan u primeni metoda statističke obrade ovakvih setova podataka. Srednja vrednost, varijansa i standardna devijacija, koje su pre svega prilagođene normalnoj raspodeli, mogu da budu nepouzdani ili krajnje pogrešni parametri za karakterisanje ovakvih setova podataka. U ovakvim slučajevima mnogo pozdanija alternativa su medijana i kvartili. Medijana i kvartili se zgodno mogu grafički prikazivati i to uz pomoć «kućica» (box plot). Tada se često grafički prikazuju minimalna i maksimalna vrednost celog seta merenja, prvi i treći kvaril, kao i medijana (slika 20a). Interkvartilni raspon (IKR), koji se proteže od I do III kvarila obuhvata 50% svih merenja.

IKR – Interkvartilni raspon

(a) Nesimatrična ili deformisana raspodela

(b) Nesimatrična ili deformisana raspodela

(c) Normalna ili simetrična

raspodela Slika 20. Razlika između nesimatrične ili deformisane i normalne raspodela

Kod nesimetričnih raspodela neretko se pojavljuju neočekivano velike vrednosti za maksimum ili minimum (slika 8a i 8b). Te vrednosti se mogu po neki put odbaciti, kao što se to radi i u slučajevima normalne raspodele, ali po nekim drugim kriterijumima. Sigurno odbacivane se može vršiti ako su neke vrednosti u setu merenja veće za 3 IKR od III kvartila, odnosno ako su manje za 3 IKR od I kvartila. Pored sigurno odbačenih vrednosti (puni kružići na slici 20b) postoje i potencijalne vrednosti za odbacivanje (prazni kružići na slici 20b) koje se nalaze u intervalu od 1,5 IKR i 3 IKR s

Ivan Gržetić, HF 32

Page 33: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

gornje strane III kvartila ili s donje strane I kvartila. Ako se graničnici u grafiku postave na rasojanju od I i III kvartila na 1,5 x IKR (K1 – 1,5 IKR i K3 + 1,5 IKR) (slika 20b) tada se, u zavisnosti od asimetrije (prema manjim ili prema većim vrednostima), potencijalne vrednosti za odbacivanje mogu svrstati na one koje ulaze u interval od K3 do K3 + 1,5 IKR za asimetrije prema manjim vrednostima (odnosno od K1 do K1 – 1,5 IKR za asimetrije prema većim vrednostima) i one koje se nalaze unutar graničnika. Sve ostale vrednosti se nalaze izvan graničnika, s tim što se izvan graničnika mogu nalaziti vrednosti koje nisu odbačene, ali i one koje su sigurno odbačene. Ukoliko graničnici izlaze izvan okvira minimalne ili maksimalne vrednosti, tada se umesto njih korste vrednosti za minimum ili maksimum. Kao primer neka posluže dva seta podataka (merenja) B1 i B2:

Set B1 = {0,08; 0,10; 0,15; 0,17; 0,24; 0,34; 0,38; 0,42; 0,49; 0,50; 0,70; 0,94; 0,95; 1,26; 1,37; 1,55; 1,75; 3,20; 6,98; 50,57} Set B2 = {0,11; 0,18; 0,23; 0,51; 1,19; 1,30; 1,32; 1,73; 2,06; 2,16; 2,37; 2,91; 4,50; 4,51; 4,66; 14,68; 14,82; 27,44; 39,41; 41,04}

Njihove vrednosti za medijanu, kvartile i graničnike prikazane su na slici 21.

Set B1: 20 merenja

M = 0,60 K3 = 1,46 K1 = 0,29 IKR = K3 – K1 = 1,17 1,5 IKR = 1,76 Gornji graničnik = K3 + 1,5 IKR = 3,22 Donji graničmik = K1 – 1,5 IKR = - 1,47 Kako u setu B1 nema manjih vrednosti od 0,08 umesto izračunatog donjeg graničnika ucrtava se minimalna vrednost.

Set B2: 20 merenja

M = 2,27 K3 = 9,67 K1 = 1,25 IKR = K3 – K1 = 8,42 1,5 IKR = 12,63 Gornji graničnik = K3 + 1,5 IKR = 22,3 Donji graničmik = K1 – 1,5 IKR = - 11,38 Kako u setu B2 nema manjih vrednosti od 0,11 umesto izračunatog donjeg graničnika ucrtava se minimalna vrednost.

Slika 21. Prikaz asimetričnihsetova merenja putem njihovih medijana, kvartila i izračunatih graničnika

IKR – interkvartilni raspon kod nesimetričnih (nenormalnih) raspodela po analogiji preuzima ulogu standardne devijacije koju ona ima u normalnoj (simetričnoj) raspodeli iako se matematički bitno razlikuju.

Ivan Gržetić, HF 33

Page 34: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Radi poređenja na slici 20c je dat primer sa normalnom raspodelom za veliki broj merenje. U tom specijalnom slučaju IKR korespondira intervalu od 1,37 σ što je izračunato na bazi podataka iz tabele 1: za traženi procenat pouzdanosti od 50% i npr. 20 merenja: k = 0,687, odnosno 2k = 1,37. Po analogiji, medijana odgovara srednjoj vrednosti, a na slici 20c se ove dve vrednosti upravo poklapaju.

4.1. RAZLIKA IZMEĐU MEDIJANE I SREDNJE VREDNOSTI ODNOSNO KVARTILA I DEVIJACIJE

Za prethodno pomenute setove podataka B1 i B2 konstatovano je da su sačinjeni od elemenata koji su nesimetrično raspodeljeni, pa se zato na njih ne može primeniti statistička obrada karakteristična za normalnu raspodelu. Pa i pored toga, namerno će se uraditi postupak obrade podataka kao za normalnu raspodelu da bi se uočile razlike između medijane i srednje vrednosti, odnosno I i III kvartila i standardne devijacije za traženi stepen pouzdanosti od 50% (1,37*s) kako bi se uočile razlike – greške koje se pri tome prave (tabela 8), a zatim će se te greške i prodiskutovati.

Tabela 8. Razlike između medijane i srednje vrednosti, odnosno kvartika i devijacije SET B1 SET B2

Medijana M = 0,60 Medijana M = 2,27 Srednja vrednost x = 7,07 Srednja vrednost x = 8,46 I i III Kvartil K1 = 0,29; K3 = 1,46 I i III Kvartil K1 = 1,25; K3 = 9,67 Standardna devijacija s s = 18,53 Standardna devijacija s s = 12,78 x - 1.37*s; x + 1.37*s 7,07-25.39;

7,07+25.39x - 1,37*s; x + 1,37*s 8,46-12,78;

8,46+12,78x - 1.37*s; x + 1.37*s 0,08; 32,46 x - 1.37*s; x + 1.37*s 0,11; 21,24

U odnosu na medijanu podaci iz bilo kog seta (B1 ili B2) ujednačeno su raspodeljeni s leve i s desne strane od medijane. U intervalu od K1 do K3 zaista je okupljeno 50% od ukupnog broja merenja. To znači da ovi podaci mogu da predstavljaju reprezentativne vrednosti na bazi kojih se izvode dalji zaključci koji će imati očekivan smisao i pouzdanu upotrebu. U odnosu na srednju vrednost u setu B1 s leve strane nalazi se 19 podataka, a s desne strane samo jedan podatak. U istom setu u statistički definisanom intervalu standardne devijacije za očekivanih 50% od ukupnog broja merenja zaista se nalazi 19 podataka ili 95% merenja i to većinom s leve strane od srednje vrednosti, a ne očekivanih 10 merenja simetrično raspoređenih oko srednje vrednosti. Set je očigledno nesimetričan, odnosno nema normalnu raspodelu. Srednja vrednost ovog seta je preterano velika i stvara zabunu kad se poredi sa medijanom koja je mnogo približnija svojom vrednošću najvećem broju merenja u ovom setu. U odnosu na srednju vrednost u setu B2 s leve strane nalazi se 15 podataka, a s desne strane samo 5 podataka. U istom setu u statistički definisanom intervalu standardne devijacije za očekivanih 50% od ukupnog broja merenja zaista se nalazi 18 podataka ili 90% merenja i to većinom s leve strane od srednje vrednosti, a ne očekivanih 10 merenja simetrično raspoređenih oko srednje vrednosti. I oval set je očigledno nesimetričan, odnosno nema normalnu raspodelu. Ovo znači da podaci koji su izvedeni uz pomoć statistike za merenja sa normalnom raspodelom uopšte ne predstavljaju reprezentativne vrednosti na bazi kojih se mogu izvoditi bilo kakvi dalji zaključci, ukoliko se i načine, neće imati nikakav smisao, odnosno to će biti očigledni grubi promašaji zbog nepoznavanja pravilnog postupka pri analizi greške.

Ivan Gržetić, HF 34

Page 35: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

NAPOMENA: Rezultati merenja koja se ponavljaju i koja se vrše sa ciljem da se što tačnije ustanovi veličina neke fizičke vrednosti (visina, dužina, težina, gustina, tvrdina...) najčešće se i najlakše svrstavaju u setove merernja sa normalnom raspodelom. Merenja koja se odnose na praćenje promena nekog mernog parametra u funkciji od vremena i/ili prostora (hemijski sadržaj, fazna ili stratifikovana raspodela...) mogu samo ponekad da se svrstaju u setove merernja sa normalnom raspodelom, ali najčešće to nije moguće. Praćenje sadržaja korisne rudne komponente, koncentracije zagađivača, ili nekih drugih parametara sa nepredvidivom raspodelom, odnosno zbog nemogućnosti da se bilo koje merenje u setu merenja odbaci, ne mogu se statistički obrađivati kao setovi merernja sa normalnom raspodelom, već mnogo češće kao setovi sa nesimetričnom raspodelom, a tada je rad sa medijanom i kvartilima mnogo pravilniji i bezbedniji pristup obrade podataka. 5. KORELACIJA Korelacija je mera uzajamne povezanosti između dva seta merenja ili dve grupe podataka. Mera uzajamne povezanosti izražava se korelacijonim koeficijentom. Korelacija može biti linerana ili nelinearna. U ovom tekstu obrađivaće se prosta ili linearna korelacija. Na početku je vrlo važno napomenuti da se primenom linearne korelacije na podatke koji su nelinearno korelisani mogu izvesti vrlo pogrešni zaključci!

5.1. KOEFICIJENT KORELACIJE Korelacija se iskazuje koeficijentom korelacije (r) koji se kreće od -1, setovi se nalaze u potpunoj obrnutoj srazmeri ili u negativnoj korelaciji, preko nule kada nema nikakve korelacije, do +1 kada se setovi merenja nalaze u direktnoj srazmeri, odnosno u pozitivnoj korelaciji. Pozitivna korelacija znači da su velike vrednosti x serije asocirane sa velikim vrednostima y serije i da su male vrednosti x serije asocirane sa malim vrednostima y serije. Negativna korelacija znači da su male vrednosti x serije asocirane sa velikim vrednostima y serije i da su velike vrednosti x serije asocirane sa malim vrednostima y serije. Najrasprostranjeniji oblik korelacijone analize je prosta linearna korelacija. Ona se bazira na metodi najmanjih kvadrata. Smisao ove metode jeste da se kroz set podataka ili mernih vrednosti provuče prava tako da zbir kvadrata rastojanja između prave i pojedinačnih mernih vrednosti bude što manji. Prosti linearni korelacijoni koeficijent ili koeficijent korelacije (r) je neimenovani broj i izračunava se na sledeći način:

21

21

1

)()()])(([yyxx

yyxxri

Ni

Nii

N

xy−Σ−Σ

−−Σ= , s tim što se sređivanjem ove jednačine dobija:

])(][)([))((

2222iiii

iiiixy

yyNxxNyxyxNr

Σ−ΣΣ−Σ

ΣΣ−Σ=

gde su: N broj sparenih vrednost x i y, Σxy suma proizvoda sparenih vrednosti, Σx suma x vrednosti, Σy suma y vrednosti, Σx2 suma kvadrata x vrednosti, Σy2 suma kvadrata y vrednosti. U suštini linearnom korelacijom dobija se prava (slike 19 a – f) definisana poznatom jednačinom y = ax + b u kojoj bi koeficijenat a odgovarao koeficijentu korelacije (r). Bilo kakva izmena ma koje vrednosti koja se koristi za izračunavanje koeficijenta korelacije uticaće na nagib prave koja definiše linearnu korelaciju između dva seta vrednosti.

Ivan Gržetić, HF 35

Page 36: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Postavlja se pitanje koliko merenja treba posedovati da bi korelacija bila pouzdana? Odgovor je tesno povezan sa izračunavanjem standardne devijacije, što je broj merenja u serijama koje se koreliraju veći, to je korelacija pouzdanaija. Takođe se pokazalo da ako je mali broj merenja (ispod 30) promena rezultat samo jednog merenja lako menja vrednost r, odnosno dodatak ili odbacivanje jednog merenja čini to isto. Tek kada se broj podataka popne do 100 ovakve promene nemaju vidnog uticaja na koeficijent korelacije.

5.2. TUMAČENJE LINEARNOG KEFICIJENTA KORELACIJE Iako ne postoje tačno propisane vrednosti moguće je definisati veličinu ili magnitudu korelacije:

• od -1,0 do -0,7 se definiše kao jaka negativna korelacija, • od -0.7 do -0.3 se definiše kao slaba negativna korelacija, • od -0.3 do +0.3 se smatra da nema korelacija, • od +0.3 do +0.7 se definiše kao slaba pozitivna korelacija, i • od +0.7 do +1.0 se definiše kao jaka pozitivna korelacija.

Kako grafički izgledaju različiti oblici linearne korelacije prikazano je na slikama 22 a – f.

(a) Potpuna pozitivna korelacija (nema

nikave disperzije podataka) (b) Jaka pozitivna korelacija sa neznatnim

međusobnim neslaganjem podataka

(c) Slaba pozitivna korelacija sa prisutnim

neslaganjem podataka (d) Podaci bez ikakve korelacije

Ivan Gržetić, HF 36

Page 37: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

(e) Slaba negativna korelacija sa prisutnim

neslaganjem podataka (f) Jaka negativna korelacija sa neznatnim

međusobnim neslaganjem podataka Slika 22. Grafički prikaz različitih oblika linearne korelacije

5.2.1. Primer za linearnu korelaciju

Neka je određivan sadržaj Fe (y vrednosti) u sfaleritu na različitim mestima (N = 20) i različitim dubinama od površine kristala (x vrednosti) (tabela 9). Podaci koji su prikazani su takvi da se ne može lako sagledati da li postoji neki odnos ili korelacija između dva seta podataka: sadržaja Fe i dubine (x i y). Da bi se to sagledalo najbolje je da se odredi koeficijent korealacije koji će nam otkriti traženi odnos.

Tabela 9. Podaci o sadržaju Fe u sfaleritu na različitim dubinama od površine kristala i prateće vrednosti značajne za izračunavanje korelacije

Br. merenja (i)

Dubina u µm (xi)

Sadržaj Fe u % (yi)

xi*yi xi*xi yi*yi

1 68 4,1 278,8 4624 16,812 71 4,6 326,6 5041 21,163 62 3,8 235,6 3844 14,444 75 4,4 330 5625 19,365 58 3,2 185,6 3364 10,246 60 3,1 186 3600 9,617 67 3,8 254,6 4489 14,448 68 4,1 278,8 4624 16,819 71 4,3 305,3 5041 18,49

10 69 3,7 255,3 4761 13,6911 68 3,5 238 4624 12,2512 67 3,2 214,4 4489 10,2413 63 3,7 233,1 3969 13,6914 62 3,3 204,6 3844 10,8915 60 3,4 204 3600 11,5616 63 4,0 252 3969 1617 65 4,1 266,5 4225 16,8118 67 3,8 254,6 4489 14,4419 63 3,4 214,2 3969 11,5620 61 3,6 219,6 3721 12,96

Ivan Gržetić, HF 37

Page 38: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Br. merenja (i)

Dubina u µm (xi)

Sadržaj Fe u % (yi)

xi*yi xi*xi yi*yi

Σ 1308 75,1 4937,6 85912 285,45

Koristeći se formulom za izračunavanje koeficijenta korelacije i podataka iz tabele 5 dobijaju se sledeće vrednosti:

N = 20 Σxy = 4937,6 Σx = 1308 Σy = 75,1 Σx2 = 85912 Σy2 = 285,45

Na bazi prethodnih podataka i zamenom u gornjoj jednačini za izračunavanje koeficijenta korelacije dobija se:

)1,75*1,7545,285*20(*)1308*130885912*20(1,75*13086,4937*20

−−−

=r

73,03514,713

2,5212,508870

2,521===r

Rezultat ukazuje na jaku pozitivnu korelaciju (r = 0,73) između dubine i sadržaja Fe, a to znači da sa porastom dubine raste i sadržaj Fe u supstratu koji se ispitivao (slika 23).

Korelacija sadržaja Fe i dubine

3

4

5

50 60 70 80Dubina u mikrometrima

Sadr

žaj F

e u

%

Sadržaj Fe u %

Slika 23. Korelacija sadržaja Fe i dubine u µm

6. PROPAGACIJA GREŠKE Često se događa da se čitav niz zaključivanja o bogatstvu neke rude, kvalitetu nekog proizvoda ili sličnog bazira na merenjima kao primarnim podacima, a potom se ti podaci obrađuju tako da je konačni zaključak ustvari indirektni rezultat. Taj indirektni rezultat nastaje proračunima koji polaze od egzaktnih merenja koja obično imaju svoju srednju vrednost i odgovarajuću devijaciju. Vrlo važno pitanje je tada kolika je ukupna (kumulativna) greška konačnog rezultat ili zaključka? Na primer, ako je Z zbir dva parametra dobijenih merenjima u dva seta merenja A i B koji u sebi sadrže greške ∆A i ∆B može se dobiti rezultat Z = A + B koji nema nikakvih podataka o grešci ili rezultat koji vodi računa o grešci:

Z = (A+∆A) + (B+∆B) = (A+B) + (∆A+∆B)

Ivan Gržetić, HF 38

Page 39: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

i Z = (A-∆A) + (B-∆B) = (A+B) - (∆A+∆B)

Ovi rezultati uključuju grešku, ali korelišu +∆A i +∆B, odnosno –∆A i –∆B čime se dobija nagori mogući slučaj za veličinu greške ∆Z = ±(∆A+∆B). Na primer, ako je A = 100 ± 3, a B = 6 ± 4 tada je Z = 106 ± 7, s obzirom da je 3 + 4 = 7. Onda kada greške nisu pozitivno korelisane, odnosno kada su rezultati međusobno nezavisni, primenjuje se druga formula za izračunavanje kumulativne greške:

22 )()( BAZ ∆+∆=∆ U ovom slučaju ∆Z predstavlja prosečnu grešku jer kod nezavisnih merenja pojedinačne greške mogu međusobno da se isključe ili da se saberu što ne može tačno da se predvidi. Ova prosečna greška je tada manja od prostog zbira pojedinačnih grešaka. Na primer, ako je A = 100 ± 3, a B = 6 ± 4 tada je Z = 106 ± 5, s obzirom da je 543 22 =+ .

6.1. IZRAČUNAVANJE KUMULATIVNE GREŠKE Polazeći od prethodnog primera moguće je proučiti i generalno pravilo za izračunavanje kumulatibne greške. Neka se koriste dve vrednosti A i B koji se koriste za dobijanje konačnog rezultat Z i neka postoji neka funkcionalna zavisnost (f) između (A,B) i Z tada se može napisati da je Z = f(A,B), a formula za izračunavanje kumulativne greške glasi:

22

22

)()( BBFA

AFZ ∆

∂∂

+∆

∂∂

=∆ ,

pri čemu se za slučaj sabiranja Z = A + B uzima da su

∂∂

AF

= 1 i

∂∂

BF = 1. Kada se radi o

oduzimanju Z = A – B onda su

∂∂

AF = 1 i

∂∂

BF

= -1. Za slučaj proizvoda Z = A*B imamo

da su

∂∂

AF = B i

∂∂

BF = A, pa sledi da je 2222 )()( BAABZ ∆+∆=∆ , odnosno da je

22

∆+

∆=

∆=

BB

AA

ZZ

ABZ .

Na primer, ako je Z = (100 ± 0,3)*(6 ± 0,4) onda je Z = 600 ± 22

64,0

1003,0

+

= 600 ± 40.

U slučaju da je Z = A2 tada se dobija sledeći račun: (A ± ∆A)2 = A2 ± 2A ∆A, odnosno ako je A= 10 ± 1, tada je A2 = (10 ± 1)2 = 100 ± 20. U tabeli 10 dati su konačni izrazi za izračunavanje kumulativne greške poštujući prethodnu opštu formulu za različite izraze u kojima je Z zavisno od jedne (A ili B vrednosti) odnosno od obe vrednosti.

Ivan Gržetić, HF 39

Page 40: HEMIJA ŽIVOTNE SREDINE II - helix.chem.bg.ac.rshelix.chem.bg.ac.rs/~grzetic/predavanja/Hemija zivotne sredine II... · HEMIJA ŽIVOTNE SREDINE II _____ ANALITIČKE GREŠKE I STATISTIČKA

HEMIJA ŽIVOTNE SREDINE II

___________________________________________________________________________

Ivan Gržetić, HF 40

Tabela 10. Izračunavanje kumulativne greške za različite izraze ili operacije

Matematička operacija Konačna formula za izračunavanje kumulativne greške Z = A + B 22 )()( BAZ ∆+∆=∆

Z = A – B 22 )()( BAZ ∆+∆=∆

Z = AB 22

∆+

∆=

BB

AA

ZZ

Z = A/B 22

∆+

∆=

BB

AA

ZZ

Z = A2 AAZ ∆=∆ 2

Z = nA AAn

ZZ ∆

=

Z = lnA AAZ ∆

=∆

Z = eA AZZ

∆=

Literatura 1. Clarke, G. M., & Cooke, D. (1978). A basic course in statistics. London: Edward Arnold 2. Taylor, J. R. (1982). An Introduction to Error Analysis: The Study of Uncertainties if Physical

Measurements. University Science Books. 3. Cleveland, W. S. (1993). Visualizing data. Murray Hill, NJ: AT&T. 4. G.E. P. Box, W. G. Hunter, and J. S. Hunter (1978). Statistics for experimenters: An introduction

to design and data analysis. NY: John Wiley. General introduction. 5. Dixon, W. J., & Massey, F. J. (1983). Introduction to statistical analysis (4th ed.). New York:

McGraw-Hill. 6. Brownlee, K. A. (1960). Statistical Theory and Methodology in Science and Engineering. New

York: John Wiley. 7. Morrison, D. F. (1990). Multivariate statistical methods. (3rd Ed.). New York: McGraw-Hill. 8. Ryan, T. P. (1989). Statistical methods for quality improvement. New York: Wiley. 9. Scheffé, H. (1959). The analysis of variance. New York: Wiley. 10. Turner, J. Rick and Julian Thayer (2001). Introduction to analysis of variance. Thousand Oaks,

CA: Sage Publications.