Upload
others
View
13
Download
0
Embed Size (px)
Citation preview
Irena Januškaitienė
Aplinkos duomen� analiz�s ir modeliavimo laboratoriniai darbai Metodinė priemonė Vytauto Didžiojo universitetas Kaunas, 2009
1
2
UDK 311:004.9:504(076) Ja462
Recenzavo: doc. dr. Jonė Venclovienė Apsvarstyta ir rekomenduota spausdinti Vytauto Didžiojo universiteto Gamtos mokslų fakulteto Aplinkos katedros posėdyje 2008-11-18 ir Gamtos mokslų fakulteto tarybos posėdyje 2008-11-19 (protokolo Nr. 07-12). ISBN 978-9955-12-494-8 © I. Januškaitienė, 2009 © Vytauto Didžiojo universitetas, 2009
Turinys
�vadas......................................................................................................4 1. Pirmin� eksperimento duomen� analiz� .............................................5 2. Eksperimento duomen� analiz�. Vidurki� palyginimas. Hipotezi� tikrinimas: „t“ kriterijus, „U“ kriterijus ...............................16 3. Monitoringo duomen� analiz�..........................................................26 4. Dispersin� duomen� analiz� .............................................................35 5. Koreliacin� ir paprastoji tiesin� duomen� analiz� ............................43 6. Tiesin� priklausomyb�......................................................................51 7. Netiesin�s priklausomyb�s analiz�s modeli� naudojimas (1 dalis) ..60 8. Netiesin�s priklausomyb�s analiz�s modeli� naudojimas (2 dalis) ..68 9. Laiko sekos (1 dalis).........................................................................73 10. Laiko sekos (2 dalis).......................................................................81 11–14. Kartojimo uždaviniai ................................................................86 Literat�ra ..............................................................................................91
3
�vadas
Šiandien aplinkotyros ir kit� sri�i� specialistai susiduria su dideliais kiekiais sukaupt� duomen�. Norint juos interpretuoti, daryti išvadas bei pateikti kitiems, pasitelkiami �vairiausi matematin�s statistikos metodai ir modeliai. Sukurtas ne vienas programinis paketas, leidžiantis atlikti pirmin� duomen� analiz� ir grafin� j� interpretacija. Programa „Statisti-ca“ yra integruota sistema, skirta duomen� masyv� statistinei analizei, grafikams ir diagramoms braižyti, informacijos masyvams valdyti, turi plat� bazini� analitini� proced�r�, skirt� moksliniams, verslo ar inžine-riniams skai�iavimams, pasirinkim�.
Ši mokymo priemon� skirta VDU Gamtos moksl� fakulteto studen-tams, tiriantiems besikei�ian�i� aplink� bei jos poveik� gyvajai gamtai. Laboratorini� darb� aprašymuose pateikiami �vairi� aplinkos tyrim� bei monitoringo metu, naudojant programin� paket� „Statistica“, sukaupt� duomen� analiz�s pavyzdžiai.
4
1 l a b o r a t o r i n i s d a r b a s Pirmin� eksperimento duomen� analiz�
Darbo tikslas Naudodami pirmin�s statistin�s analiz�s metodus, atlikite pirmin� eksperimento duomen� apie augimo substrato r�gštumo ir kadmio poveik� pomidor� augimui analiz�. Pateikite grafikus. Teorija Atliekant pirmin� surinkt� duomen� analiz�, pirmiausia �vertinamos
duomen� pad�ties (location) arba centro charakteristikos – vidurkis bei medina. Vidurkis yra imties „mas�s centras“. Jis labai jautrus smarkiai besiskirian�ioms reikšm�ms; pavyzdžiui, klaidingai �vesta labai didel� reikšm� pastebimai pakei�ia vidurk�. Mediana ne tokia jautri smarkiai besiskirian�ioms reikšm�ms kaip vidurkis, tod�l jei duomenys labai asimetriški ar kyla �tarimas, kad imtyje yra išskir�i�, imties centr� geriau �vertinti naudojant median�. Jei mediana labai skiriasi nuo vidurkio, kintamojo pasiskirstymas n�ra simetriškas duomen� „centro“ atžvilgiu.
Dispersija (variance) �vertina išmatuot� reikšmi� sklaid� apie vi-durk�. Standartinis nuokrypis s (programoje „Statistica“ žymima SD) – kvadratin� šaknis iš dispersijos. Jo matavimo vienetai tie patys kaip ir kintamojo. Dispersija ir standartinis nuokrypis labai jautr�s išskirtims. Analizuojant aplinkos duomenis, kaip antai augalo diametro ar aukš�io duomenis, aktualu nustatyti duomen� kintamum� palyginus su vidutine reikšme.
Teorinio nežinomo vidurkio m �vertis yra imties vidurkis x . Teori-n� x dispersija yra 2/n, standartinis nuokrypis – / n , o standartinis nuokrypio �vertis –s/ n , žymimas sx. �vertis sx vadinamas standartine vidurkio paklaida (standard error of mean, sutrumpintai SE). Kiekybi-nio rodiklio vidurkis paprastai pateikiamas kartu su savo standartine paklaida: pavyzdžiui, x ± sx.
Vieno ar keli� kiekybini� kintam�j� skaitin�ms charakteristikoms bei išskirtims grafiškai pateikti naudojama sta�iakamp� diagrama, kuri programoje „Statistica“ vadinama „box&whisker plot“. Sta�iakampe diagrama leidžiama pateikti ir imties skaitines charakteristikas, pavyz-džiui, vidurk� ir standartin� nuokryp� (SD) arba standartin� paklaid� (SE). Tokia sta�iakamp� diagrama br�žiama taip: sta�iakampio viduryje kvadrat�liu pažymimas vidurkis; sta�iakampis braižomas nuo reikšm�s
5
( SDx � ) iki ( SDx � ); jeigu atidedama standartin� paklaida, tuomet – ( SEx � ) iki ( SEx � ). Nuo sta�iakampio apa�ios br�žiamas apatinis „�sas“ t�siasi iki ( SDx 96,1� ), o viršutinis „�sas“ prasideda nuo sta�ia-kampio viršaus ir br�žiamas iki reikšm�s ( SDx 96,1� ); standartin�s pa-klaidos atveju analogiškai. 1,96 yra normaliojo skirstinio 0,975 lygio kvantilis, taigi sta�iakamp�s diagramos „�sai“ nurodo interval�, kuria-me, jei skirstinys normalusis, tur�t� b�ti maždaug 95 % imties reikšmi�.
Duomenys analizei Duotas duomen� failas „Stat Lab nr1 Pomidorai.sta“, kuriame su-
vesti duomenys apie pomidor� daig� aukšt� ir diametr� esant skirtin-goms augimo s�lygoms. Kintam�j� aprašo lange „Vars“ / „All Specs...“ rasite informacij� apie š� fail�.
Trumpas eksperimento aprašymas: Bandym� tikslas – ištirti kompleksin� skirtingo substrato r�gštin-
gumo ir toksinio metalo kadmio poveik� pomidor� populiacijos augimui, kai optimali augimo temperat�ra buvo 20,5 0C (duomen� faile 2 augimo kamera). Tyrimai buvo atliekami reguliuojamomis s�lygomis tiriant tris r�gštingumo variantus (vienas – optimalios s�lygos, kiti du – pesima-lios), papildomai tirtas toksinio metalo – kadmio poveikis. Optimalus durp�s substratas – 6,5 pH (duomen� faile kodas yra 0), pesimalus r�gš-tus – 4,0 pH (kodas – 1) ir pesimalus šarminis – 8,5 pH (kodas – 2). Sunkiojo metalo poveikiui vertinti buvo pasirinktas 3 mg/kg kadmio kiekis dirvožemyje (kodas – 1, o kontrol� – 0). Pomidorai auginti 6 sa-vaites ir kas savait� matuotas j� stieb� aukštis (H_6) ir stieb� diametr� plotis (D_6).
Darbo eiga 1 užduotis Patikrinkite, kiek skiriasi eksperimento duomen� vidurkiai nuo me-
dianos.
Pagrindiniame meniu pasirenkame komand� „Statistics“, kurioje ieš-kome komandos „Basic Satistics/Tables“, toliau „Descriptive statistics“.
Naujai atsiradusiame lange spaudžiame „Variables“. Renkam�s kintamuosius, t. y. diametrus ir aukš�ius visomis mata-
vim� dienomis (nuo „D_1“ iki „H_6“). Renkam�s „Advanced“ lap�, jame žymime, kad skai�iuot� vidurk�
(programoje mean) ir median� (median). Spaudžiame „Summary“.
6
Rezultatai pateikiami atsakym� lange:
Kaip matome, vidurkiai nuo median� skiriasi nežymiai, tad surinkti
duomenys n�ra asimetriški bei tik�tina, kad imtyje n�ra išskir�i� reikš-mi�. Galima vykdyti tolesn� duomen� analiz�.
2 užduotis Paskai�iuokite, kokie buvo pomidor� diametro ir aukš�io vidurkiai bei vidurki� standartin�s paklaidos skirtinguose substratuose, kontrolinio (optimalus substratas be kadmio) ir kadmio paveikto varianto, paskutin� matavim� dien�.
Pagrindiniame meniu pasirenkame komand� „Statistics“, kurioje ieškome komandos „Basic Satistics/Tables“. Renkam�s „Breakdown & one-way ANOVA“. Spaudžiame „OK“.
Toliau renkam�s kintamuosius: dešin�je priklausomus – dia-metr� „D_6“ ir aukšt� „H_6“, o kair�je grupuojamuosius – substrat� „SUBSTRAT“ ir kadmio poveik� „Cd_POVEI“.
7
Spaudžiame „OK“. Naujai atsiradusiame lange dar kart� „OK“. Toliau renkam�s „Descriptives“ lap� ir pasižymime reikiamas skai-
�iuoti statistikas bei spaudžiame „Summary“.
Atsakymas pateikiamas rezultat� lange.
Atsakym� lange matome, kokie buvo pomidor� diametro ir aukš�io
vidurkiai ir j� standartin�s paklaidos neutraliame (substrat – 0), r�gš-�iame (substrat – 1) ir šarminiame (substrat – 2) substratuose, kontroli-nio (Cd_povei – 0) ir kadmio paveikto (Cd_povei – 1) variant�.
3 užduotis Grafiškai pateikite pomidor� diametro ir aukš�io vidurkius skirtin-guose substratuose, kontrolinio ir kadmio paveikto variant�, pasku-tin� matavim� dien�.
Gr�žtame � skai�iavim� komandin� lang� „Statistics by groups – ...“. Renkam�s „Descriptives“ lap�. Spaudžiame „Categorized box & whisker“.
8
Toliau pažymime, kokio tipo grafik� pateikti, t. y. „Mean/SE/1,96*SE“,
ir renkam�s abu kintamuosius „D_6“ ir „H_6“.
Spaudžiame „OK“.
Atsakym� lange sutvarkome pateiktus abu „D_6“ ir „H_6“ grafikus, t. y. parašome pavadinim� bei aprašome „x“ ir „y“ ašis.
Remdamiesi gautais skai�iavim� rezultatais bei grafikais, atsakykite
� šiuos klausimus: a. Kokios augimo s�lygos buvo palankiausios pomidorams augti? b. Kokiomis augimo s�lygomis pomidor� diametro vidurkis buvo
mažiausias? c. Kokiomis augimo s�lygomis pomidor� aukš�io vidurkis buvo
mažiausias?
9
4 užduotis 1. Paskai�iuokite, kaip kito pomidor� diametras eksperimento me-
tu, t. y. nuo pirmo iki paskutinio matavimo. a. Kontrolinio varianto neutraliame substrate pH 6,5. b. Neutraliame substrate pH 6,5 �terpus 3mg/kg kadmio.
Pirmiausia atliksime užduoties pirm�j� dal� (a). Pagrindiniame meniu pasirenkame komand� „Statistics“, kurioje ieš-
kome komandos „Basic Satistics/Tables“, toliau „Descriptive statistics“.
Naujai atsiradusiame lange spaudžiame „Variables“ ir renkam�s kintamuosius, diametrus visomis matavim� dienomis, t. y. „D_1“, „D_2“, „D_3“, „D_4“, D_5“, D_6“ ir spaudžiame „OK“.
Naujai atsiradusiame lange žymime reikiam� statistik�, vidurk� (mean) ir standartin� paklaid� (Std. Err. of mean). Spaudžiame „Select Cases“.
„Select Cases“ lange nurodomos s�lygos, kuriuos duomenis �traukti � skai�iavim�. S�lyga „v4=0“ reiškia �traukti � skai�iavim� tik tuos variantus, kai kintamasis „SUBSTRAT“ (arba sutrumpintai „v4“) yra neutralus. Kadangi duomen� faile jis užkoduotas skai�iumi 0, tai ir rašome „v4=0“. S�lyga „v5=0“ reiškia �traukti � skai�iavim� tik kontro-lin� variant� „Cd_povei“ (arba sutrumpintai „v5“), kuris duomen� faile užkoduotas skai�iumi 0, taigi ir rašome „v5=0“.
10
Paraš� s�lygas, spaudžiame „OK“, o naujai atsiradusiame lange –
„Summary“. Rezultatai pateikiami atsakym� lange, kuriame pasižymime, jog tai
yra pomidor�, augusi� neutraliame substrate pH 6,5 be kadmio (kontro-l�), diametr� vidurkiai bei standartin�s paklaidos.
Nor�dami pateikti duomenis grafiškai, gr�žtame � komandin� lang�
„Descriptive Statistics:....“ „Options“ lape pasižymime grafiko tip�: vidurkiai su standartine
paklaida „SE“ bei „1,96*SE“.
11
Toliau renkam�s „Quick“ lap� ir jame spaudžiame „Box & whisker pot for all variables“.
Atsakym� lange pateikiamas grafikas. Parašome grafiko pavadini-
m� bei aprašome „x“ ir „y“ ašis. Pateikt� grafik� galima pakeisti � stulpelin� diagram� su
1,96*SE. Tam reikia atlikti kelis žingsnius. Pirma ant paveikslo spaudžiame dešin� pel�s klaviš� ir pasirenkame „Graph Properties (All Options)...“
„All Options“ lange renkam�s „Plot: Bars“ lap�, kuriame žymime
„Display bars“ ir „Columns“. Spaudžiame „OK“.
12
Grafikas pasikei�ia:
Jeigu norime nerodyti paklaidos „SE“ d�žut�s, atsidarome „Graph
Properties (All Options)...“ lang� kaip nurodyta aukš�iau. Pasirenkame „Plot: Spreads“ lap� ir panaikiname varnel� prie „Display inner spread“. Spaudžiame „OK“.
13
Atsakym� lange pateikiamas naujas grafikas:
Norint atlikti užduoties antr�j� dal� (b), visk� reikia kartoti analogiškai,
tik užrašyti kit� skai�iavimo s�lyg� – „Select Cases“. Šiuo atveju reikia pakeisti tik antr�j� s�lygos dal�, o pirmoji lieka ta pati. Taigi vietoj „v5=0“ rašome „v5=1“, t. y. imame tik kadmio paveiktus. „Cd_povei“ arba sutrumpintai „v5“ stulpelyje šis variantas užkoduotas skai�iumi 1.
14
Toliau kartokite visus ankstesnius žingsnius. 2. Remdamiesi gautais skai�iavim� rezultatais bei grafikais, atsa-kykite � šiuos klausimus:
a. Ar skiriasi pomidor� diametro augimas kontroliniame ir kadmio paveiktame variantuose?
b. �vardykite statistiškai patikimus pomidor� diametro vidur-kio skirtumus tarp skirting� kontrolinio varianto matavim�, t. y. tarp pirmos ir antros, antros ir tre�ios ir t. t. savai�i�?
c. �vardykite statistiškai patikimus pomidor� diametro vidur-kio skirtumus tarp skirting� kadmio paveikto varianto ma-tavim�, t. y. tarp pirmos ir antros, antros ir tre�ios ir t. t. sa-vai�i�?
5 užduotis Grafiškai pateikite, kaip kito pomidor� diametras eksperimento me-tu, t. y. nuo pirmo iki paskutinio matavimo. a. R�gštaus substrato pH 4,0 kontrolinio varianto. b. Neutralaus substrato pH 4,0 �terpus kadmio. Ši� užduot� atlikite analogiškai kaip paaiškinta, kei�iasi tik „Select
Cases“ lange rašomos s�lygos. Tad savarankiškai užrašykite s�lygas ir nubraižykite grafikus.
Klausimai savikontrolei: Kokias žinote pirmin�s duomen� analiz�s statistikas? Kuo skiriasi mediana ir vidurkis? Kas vaizduojama „box&whisker plot“ diagramose?
15
2 l a b o r a t o r i n i s d a r b a s Eksperimento duomen� analiz�
Vidurki� palyginimas. Hipotezi� tikrinimas: t kriterijus, U kriterijus
Darbo tikslas Naudodami vidurki� palyginimo analiz�s metodus, nustatykite, ar skirtingomis augimo s�lygomis augusi� pomidor� diametr� ir aukš-�i� vidurkiai skiriasi statistiškai patikimai. Teorija Populiacijos skirstinio vidurkis vertinamas imties vidurkiu x .
Normaliojo ats. d. kintamum� charakterizuoja dispersija arba standarti-nis nuokrypis. Tod�l pateikiant �vertint� kintamojo (populiacijos) vidur-k�, pateikiamas ir jo standartinio nuokrypio �vertis. Standartinio nuokry-pio �ver�iai dar vadinami standartin�mis paklaidomis (standard error), žymimi SE (...).
Tarkime, kiekybinis kintamasis turi unimodal� skirstin�, kurio vi-durkis m, dispersij� 2. Teorinio nežinomo vidurkio m �vertis yra imties vidurkis x . Teorin� x dispersija – 2/n, standartinis nuokrypis – / n , o standartinis nuokrypio �vertis – s/ n , žymimas sx. �vertis sx vadinamas standartine vidurkio paklaida (standard error of mean, su-trumpintai SE). Kiekybinio rodiklio vidurkis paprastai pateikiamas kartu su savo standartine paklaida: pavyzdžiui, x ± sx.
Tarkime, X – tolydusis ats. d., turintis vidurk� m ir dispersij� 2, x1, x2, ..., xn – šio ats. d. imtis (xi – normalusis ats. d.). Vidurkio m �vertis yra imties vidurkis x . Jis taip pat atsitiktinis: skirting� konkre�i� im�i� x reikšm�s, kartu ir m �ver�iai, skirsis. Tod�l aktualu �vertinti vidurkio �ver�io patikimum� – nustatyti, kaip jis skiriasi nuo tikrosios parametro reikšm�s.
Nežinomo parametro �ver�io patikimumui vertinti �vedama pasi-kliovimo lygmens s�voka. Parenkamas vadinamasis pasikliovimo lyg-muo (confidence level) arba patikimumas P – skai�ius, artimas vienetui, pvz., P = 0,9; 0,95; 0,99. Pasikliovimo lygmuo P yra tikimyb�, jog skirstinio parametras � yra intervale [�ap(x), �virš(x)], �ia x = (x1, x2, ..., xn) – atsitiktin� imtis – nepriklausomi ats. d.
Normaliojo skirstinio vidurkio pasikliautiname intervale su statis-tine tikimybe P yra skirstinio vidurkio reikšm� m. Tai reiškia, kad ap-
16
skai�iavus tam tikro konkre�i� im�i� skai�iaus vidurkio PI, P procent� atvej� skirstinio vidurkio reikšm� bus apskai�iuotame pasikliautiname intervale. Dydis s/ n , naudojamas vidurkio pasikliautino intervalo formul�je, yra imties vidurkio standartin� paklaida; taigi žinant imties vidurk� ir standartin� paklaid� galima paskai�iuoti bet kurio patiki-mumo vidurkio pasikliautin� interval�. Jei imtis didel� (n > 100), tuo-met vidurkio pasikliautinojo intervalo formul�je vietoj Stiudento skirs-tinio kvantilio galima naudoti standartinio normaliojo skirstinio atitin-kamo lygio kvantil� – kai P = 0,95, (1 + P)/2 = 0,975, z0,975 = 1,96.
Hipotezi� tikrinimas. Taisykl�, pagal kuri�, remdamiesi turima im-timi x = (x1, x2, ..., xn), nulin� hipotez� atmetame arba jai neprieštarauja-me, vadiname statistiniu kriterijumi. Statistiniam kriterijui apibr�žti nau-dojama kriterijaus statistika – atsitiktin�s imties x funkcija t(x), esant tei-singai H0 turinti žinom� skirstin� ar asimptotin� skirstin�, ir kuo didesn� ar (ir) kuo mažesn� t reikšm�, tuo labiau tik�tina alternatyva. Dažniausiai sutinkami t(x) skirstiniai yra standartinis normalusis ir Stiudento. t(x) sta-tistika dažnai yra standartizuotas santykis. Pagal statistikos t(x) konkre�i� reikšm�, nulin� hipotez� atmetame arba jai neprieštaraujame.
t kriterijus dviem imtims dažniausiai taikomas, kai reikia paly-ginti dviejose populiacijose stebimus požymius, t. y. t� požymi� vi-durkius. Taikant t kriterij�, reikalaujama, kad stebimas dydis tur�t� normal�j� skirstin�. Formuluojama hipotez� H0: x 1= x 2. Jai alterna-tyvi hipotez� H1: x 1 � x 2. H0 tikrinti naudojamas Stiudento nepri-klausom� im�i� t kriterijus su statistika (t(x)):
)/1/1(2 mnsyxt
p �
��
�ia x ir y – im�i� vidurkiai, – im�i� sujungta dispersija. 2pS
Esant teisingai H0 – „populiacij� vidurkiai vienodi“, statistika t turi Stiudento skirstin� su (n + m – 2) laisv�s laipsni�.
Dviej� populiacij� vidurkiui palyginti taip pat naudojamas U kriteri-jus. Tuomet, kai imtys labai mažos (n, m 10) arba mažos (10 < n, m 30), arba kai duomenys asimetriški, dviem vidurkiams palyginti reko-menduojama naudoti U kriterij�. Prielaidos: kintamojo iš X ir Y populia-cijos skirstiniai yra tolydieji ir skiriasi tik poslinkiu. Poslinkiui, atsiradu-siam d�l per�jimo iš vienos populiacijos � kit�, konstatuoti naudojamas U kriterijus (U test).
17
H0: � = 0 tikrinti naudojamo U kriterijaus statistika skai�iuojama naudojant ne reikšmes, o rangus. Visos turimos im�i� n + m reikšm�s suranguojamos. Kadangi kintamojo skirstinys tolydusis, abiejose imtyse mažai tik�tinos pasikartojan�ios reikšm�s arba vienodi rangai. U kriteri-jaus statistika lygi imties iš Y populiacijos rang� sumai. Esant teisingai nulinei hipotezei, rang� sumos skirstinys yra diskretusis, simetriškas vidurkio atžvilgiu ir priklauso tik nuo n ir m. Nedideliems n ir m lentel�-se pateikiami U statistikos skirstinio atitinkamo lygio kvantiliai, o statis-tiniuose paketuose (pvz., „Statistica“) tikslaus ar asimptotinio kriterijaus dvipus� p reikšm�. Jei p < 0,05, daroma išvada, kad vidurkiai skiriasi statistiškai reikšmingai.
Duomenys analizei Duotas duomen� failas „Stat Lab nr1 Pomidorai-2.sta“, kuriame
suvesti duomenys apie pomidor� daig� aukšt� ir diametr�, esant skirtin-goms augimo s�lygoms. Kintam�j� aprašo lange „Vars“ toliau „All Specs....“ rasite informacij� apie š� fail�. Trumpas eksperimento apra-šymas pateikiamas pirmajame laboratoriniame darbe. Šiame darbe išsa-miau panagrin�sime pomidor� augim� skirtinguose augimo substratuose pirm�, antr� ir šešt� matavim� savaites.
Darbo eiga 1 užduotis 1. Paskai�iuokite, koks buvo pomidor� diametro vidurkis ir vidur-kio pasikliautinis intervalas esant 95 % tikimybei, skirtinguose sub-stratuose pirm�, antr� ir paskutin� matavim� dienas.
Pagrindiniame meniu pasirenkame komand� „Statistics“, kurioje ieškome komandos „Basic Satistics/Tables“. Renkam�s „Breakdown & one-way ANOVA“. Spaudžiame „OK“.
Renkam�s priklausomus kintamuosius: „D_1“, „D_2“ ir „D_6“, bei grupavimo kintam�j� „Substrat“. Spaudžiame „OK“.
Naujai atsidariusiame lange parenkame grupavimo kodus, t. y. spaudžiame „Codes for grouping variables“. Parenkame visus „All“. Spaudžiame „OK“.
Komandiniame lange atsidarome „Descriptives“ lap� ir pasižymime mums reikiam� charakteristik� – pasikliautin� interval� su 95 % tikimybe („Conf. Limits for mean 95%“). Spaudžiame „Summary“.
18
Skai�iavim� rezultatai pateikiami atsakym� lange:
Jeigu 95 % tikimyb�s vidurki� pasikliautiniai intervalai (Confidence
± 95 %) persikerta, vidurkiai skiriasi statistiškai nepatikimai. Jeigu 95 % tikimyb�s vidurki� pasikliautinai intervalai (Confidence
± 95 %) nepersikerta, vidurkiai skiriasi statistiškai patikimai. 2. Remdamiesi gautais skai�iavim� rezultatais, atsakykite � šiuos klausimus:
d. Koks buvo pomidor� diametro vidurkis ir jo pasikliautinis intervalas su 95 % tikimybe skirtinguose substratuose per pirm�, antr� ir paskutin� matavimus?
e. Ar skyr�si pomidor�, augusi� skirtinguose substratuose, diametras eksperimento metu? Jei taip, tai kokiuose sub-stratuose, koks skirtum� patikimumas?
2 užduotis 1. Remdamiesi pateiktu aprašu, paskai�iuokite, koks buvo po-midor� aukš�io vidurkis ir vidurkio pasikliautinis intervalas, esant 95% tikimybei, skirtinguose substratuose pirm�, antr� ir paskutin� matavim� dienas.
19
2. Atsakykite � šiuos klausimus: a. Koks buvo pomidor� aukš�io vidurkis ir jo pasiklautinis in-
tervalas, esant 95 % tikimybei, skirtinguose substratuose per pirm�, antr� ir paskutin� matavimus?
b. Ar skyr�si pomidor�, augusi� skirtinguose substratuose, aukštis eksperimento metu? Jei taip, tai kokiuose substra-tuose bei koks skirtum� patikimumas?
3 užduotis 1. Grafiškai pateikite pomidor� diametro vidurk�, vidurkio stan-dartin� paklaid� (SE) ir vidurkio standartin� paklaid�, padaugint� iš 1,96 koeficiento (1,96*SE), iš skirting� substrat� pirm�, antr� ir paskutin� matavimo dienas.
Gr�žtame � skai�iavim� komandin� lang� „Statistics by groups – ...“. „Quick“ lape renkam�s „Categorized box & whisker plot“.
Toliau renkam�s kintamuosius: „D_1“, „D_2“, „D_6“. Paspaudus „OK“, grafikai pateikiami atsakym� lange:
Jeigu vidurki� standartini� paklaid� intervalai padauginti iš 1,96
koeficiento (±1,96*SE) nepersikerta, darome išvad�, kad vidurkiai ski-riasi statistiškai patikimai.
Jeigu vidurki� standartini� paklaid� intervalai padauginti iš 1,96 koeficiento (±1,96*SE) persikerta, darome išvad�, kad vidurkiai skiriasi statistiškai nepatikimai.
a. Remdamiesi gautais grafikais atsakykite: Kokiuose substratuose augusi� pomidor� diametro vidurkiai skiriasi statištiškai patikimai (pirm�, antr� ir paskutin� matavi-m� dienas)?
20
2. Analogiškai grafiškai pateikite pomidor�, augusi� skirtinguose substratuose, aukš�io vidurk�, vidurkio standartin� paklaid� (SE) ir vidurkio standartin� paklaid� padaugint� iš 1,96 koeficiento (1,96*SE) pirm�, antr� ir paskutin� matavimo dienas. Ir atsakykite klausim�: Kokiuose substratuose augusi� pomidor� diametro vidur-kiai skiriasi statištikai patikimai (pirm�, antr� ir paskutin� matavim� dienas)?
4 užduotis 1. Naudodami „t kriterij�“, patikrinkite, ar eksperimento metu sta-tistiškai patikimai skyr�si pomidor� diametro vidurkiai, esant neu-traliam ir r�gš�iam augimo substratamsi?
Pagrindiniame meniu pasirenkame komand� „Statistics“, toliau „Basic Statisticsand Tables“, kurioje ieškome komandos „t-test, inde-pendent, by groups“. Spaudžiame „OK“.
Naujai atsidariusiame lange pirmiausia renkam�s kintamuosius „Variables“.
„Dependent variables:“ lango dalyje pažymime „D_1“, „D_2“ ir „D_6“, „Grouping variables:“ – „SUBSTRAT“.
Paspaud� „OK“, gr�žtame � ankstesn� lang�, kuriame pažymime, ko-kiomis augimo s�lygomis augusius vidurkius lyginsime. Kadangi nori-me palyginti r�gš�iame ir neutraliame substrate augusi� pomidor� dia-metr� vidurkius, „Code for Group 1:“ rašome skai�i� 1, nes taip duome-n� faile užkoduotas r�gštus substratas, o „Code for Group 2:“ – 0, nes taip užkoduotas neutralus substratas. Spaudžiame „Summary“.
21
Rezultatai pateikiami atsakym� lange, kuriame matomi abiej� gru-pi� vidurkiai, t-testo reikšm�, patikimumo lygmuo, kiekvienos grup�s kintam�j� skai�ius, standartiniai nuokrypiai ir kt.
M�s� lyginami vidurkiai skiriasi patikimai tuo atveju, jeigu „t-testo“
„p“ reikšm� yra mažesn� už 0,05, o jeigu p>0,05, turime daryti išvad�, jog lyginami vidurkiai skiriasi statištiškai nepatikimai.
a. Remdamiesi gautais skai�iavim� rezultatais, atsakykite: Kada (kurias matavimo dienas) pomidor� diametro vidur-kiai neutraliame ir r�gš�iame substratuose skyr�si statistiš-kai patikimai?
2. Naudodami „t kriterij�“, patikrinkite, ar eksperimento metu sta-tistiškai patikimai skyr�si pomidor� diametro vidurkiai, esant neu-traliam ir šarminiam augimo substratams? Gr�žtame � komandin� lang�, kuriame �vedame grupavimo kodus: 2 –
šarminis substratas ir 0 – neutralus substratas. Spaudžiame „Summary“.
22
a. Remdamiesi gautas skai�iavim� rezultatais, atsakykite: Kada pomidor� diametro vidurkiai neutraliame ir šarmi-niame substratuose skyr�si statistiškai patikimai?
5 užduotis 1. Naudodami „t kriterij�“, patikrinkite, ar eksperimento metu sta-tistiškai patikimai skyr�si pomidor� aukš�io vidurkiai neutraliame ir r�gš�iame augimo substratuose?
a. Kada (kurias matavimo dienas) pomidor� aukš�io vidurkiai neutraliame ir r�gš�iame substratuose skyr�si statistiškai patikimai?
2. Naudodami „t kriterij�“, patikrinkite, ar eksperimento metu sta-tistiškai patikimai skyr�si pomidor� aukš�io vidurkiai neutraliame ir šarminiame augimo substratuose?
a. Kada pomidor� aukš�io vidurkiai neutraliame ir šarminia-me substratuose skyr�si statistiškai patikimai?
6 užduotis 1. Eksperimento metu skirtingose kamerose augo tik po keturis pomidorus. Naudodami „U kriterij�“, �vertinkite, ar statistiškai pati-kimai skyr�si pomidor� diametro (D) ir aukš�io (H) vidurkiai, esant skirtingoms augimo s�lygoms (skirtingos kameros). 2.
KAMERA D H1 45 6141 37 5031 40 5491 36 5192 47 7662 41 6262 42 5232 49 9173 49 2543 37 1823 43 1843 40 164
23
Pirmiausia sukuriame duomen� fail� ir j� išsaugome. Toliau pagrin-diniame meniu pasirenkame komand� „Statistics“ bei „Nonparamet-rics“, kurioje ieškome komandos „Comparic two independent samples (groups)“. Spaudžiame „OK“.
Naujai atsiradusiame komandiniame lange pirmiausia reikia pasi-rinkti kintamuosius „Variables“, t. y. „Dependent variable list:“ lan-go dalyje pažymime „D“ ir „H“, o „Indep. (grouping) variable:“ – „KAMERA.
Toliau pažymime, jog lyginsime pirmosios ir antrosios kamer� po-midorus, t. y. „Codes for: Group 1“ ir „Group 2“ parašome „1“ ir „2“. Spaudžiame „M-V U test“.
Rezultat� lange matome, jog pirmoje ir antroje kamerose augusi�
pomidor� tiek diametro, tiek aukš�io vidurkiai nesiskiria statistiškai pa-tikimai, nes paskai�iuoto „U kriterijaus“ (Mann-Whiteney U Test) pati-kimumo lygis „p-level“ yra didesnis už 0,05.
24
Toliau palyginame pirmoje ir tre�ioje kamerose augusi� pomidor� augimo parametr� vidurkius: skai�iavim� lange „Codes for groups:...“ parašome 1 ir 3 bei spaudžiame „M-V U test“. Atsakymas pateikiamas rezultat� lange.
Dabar matome, kad pirmoje ir tre�ioje kamerose augusi� pomidor�
diametr� vidurkiai taip pat nesiskiria statistiškai patikimai. Aukš�io vi-durkiai skiriasi jau statistiškai patikimai, nes paskai�iuota „p-level“ reikšm� yra 0,020922.
Analogiškai palyginame antroje ir tre�ioje kamerose augusi� pomi-
dor� diametro ir aukš�io vidurkius. Klausimai savikontrolei: Kas yra vidurkio standartin� paklaida? Kas yra vidurkio pasikliautinis intervalas? Kada lyginami dviej� im�i� vidurkiai skiriasi statsitiškai patikimai? Kam naudojamas „U kriterijus“?
25
3 l a b o r a t o r i n i s d a r b a s Monitoringo duomen� analiz�
Darbo tikslas Naudodami pirmin�s, dažni� lenteli� bei dispersin�s duomen� ana-liz�s metodus, �vertinkite medži� b�kl� mieste.
Teorija Kaip jau buvo min�ta ankstesniuose darbuose, atliekant pirmin� su-
rinkt� duomen� analiz� pirmiausia �vertinamos duomen� pad�ties (loca-tion) arba centro charakteristikos – vidurkis bei mediana. Toliau vertina-ma išmatuot� reikšmi� sklaida apie vidurk�: dispersija (variance), standar-tinis nuokrypis, standartin� paklaida, pasikliautinis intervalas ir t. t.
Analizuojant b�kl�, dalis medži� charakteristik� apib�dinamos ka-tegorizuotai, pavyzdžiui, pakenkta ir sveika, ar skirtingos der�jimo klas�s ir t. t. Šio tipo uždaviniams spr�sti naudojamos porin�s dažni� lentel�s. Sakykime, X ir Y yra du kategorizuoti kintamieji, X �gyja r, o Y – c skirting� reikšmi�. Skirstydami individus pagal abiej� kintam�j� reikšmes, gauname rc skirting� kombinacij�. Laikoma, kad iš tiriamos populiacijos (X, Y) atsitiktinai paimto individo reikšm� yra atsitiktin�, turinti tam tikr� dvimat� skirstin�.
Dviej� kategorij� kintam�j� sujungt� skirstin� pateiksime lentele, turin�ia r eilu�i� ir c stulpeli�. Eilut�s atitinka X, o stulpeliai – Y �gy-jamas reikšmes. Lentel�s l�stel�s atitinka visas galimas rc dvima�io dydžio (X, Y) �gyjamas kombinacijas. Ši� kombinacij� �gijimo tiki-mybes pažym�kime {�ij}, kai �ij – tikimyb�, kad (X, Y) reikšm� pateks � i-tosios eilut�s ir j-tojo stulpelio susikirtime esan�i� cel�. �vyki� daž-niais pakeitus skirstin� apib�dinan�ioje lentel�je esan�ias tikimybes, gauta lentel� vadinama porine r×c dažni� lentele. Programos „Statisti-ca“ atsakym� lange pateikiamos susijusi� požymi� lentel�s bei procen-tiniai pasiskirstymai, taip pat gali b�ti paskai�iuotos statistikos nepri-klausomumo ar homogeniškumo hipotez�ms tikrinti.
Dispersin� analiz� – statistinis metodas, naudojamas tyrim� rezultatams, priklausantiems nuo vienu metu veikian�i� skirting� faktori�, apdoroti. Dispersin� analiz� padeda nustatyti svarbiausius faktorius ir �vertina j� poveik� tiriamam kiekybiniam kintamajam (atsakui). Galima išskirti kelias dispersin�s analiz�s r�šis: vienfaktor�, dvifaktor�, daugiafaktor�.
26
Dispersin� analiz�, arba F kriterijus naudojama dviej� ar daugiau populiacij� vidurki� hipotez�ms tikrinti. Kai lyginame dviej� populiaci-j� vidurkius, – F kriterijaus ir t kriterijaus (naudojamo dviej� vidurki� skirtumo hipotezei tikrinti) – išvados sutampa. Tod�l dispersin� analiz�, arba F kriterijus, taikoma tik prireikus palyginti daugiau kaip dviej� po-puliacij� vidurkius.
Atliekant vienfaktor� ir dvifaktor� dispersin� analiz�, statistiniame pakete „Statistica“ pateikiami šie skai�iavim� rezultatai: kvadrat� su-mos SS, j� laisv�s laipsniai, dispersijos �2 �ver�iai vidutiniai kvadratai MS, F kriterijus ir jo p reikšm�. Jei p viršija parinkt� reikšmingumo lygmen� , tuomet nulinei hipotezei neprieštaraujame, t. y. sakome, kad „remdamiesi tyrim� duomenimis, neturime pagrindo teigti, jog faktorius daro patikim� poveik� kiekybiniam kintamajam“. Jei p < , tuomet nulin� hipotez� atmetame, t. y. tvirtiname, jog „faktorius daro patikim� poveik� kiekybiniam kintamajam“.
Duomenys analizei Duotas duomen� failas „monitoringas.xls“, kuriame suvesti duo-
menys apie mažalapi� liep� b�kl� Kauno mieste. Duomenys surinkti vykdant medži� monitoringo darbus skirtingose miesto gatv�se. Liep� b�kl� vertinta pagal virš�ni� pakenkimo lyg� (virsunes), der�jimo klas� (derejimo), saus� šak� kiek� (sausos), vienos tre�iosios lajos (def13) bei visos lajos (visa_laj) defliacijos dyd� ir dechromacij� (dechroma); išma-tuotas medži� perimetro dydis (perimetr).
Darbo eiga 1 užduotis Programoje „Statistica“ atidarykite pateikt� „Excel“ duomen� fail�. Atidarome program� „Statistica“ ir jos lange spaudžiame mygtuk�
„Open (Ctrl-O)“. Pasirenkame reikiamo (Excel Files...) fail� tipo pava-dinim�. Nurodome direktorij�, kurioje yra tas failas, ir spaudžiame „Open“.
Naujai atsidariusiame lange reikia pasirinkti „Import selected sheet to a Spredsheet“.
Pasirenkame reikiam� lap� (Sheet1) ir spaudžiame „OK“. Pažymime „Get variable names from first row“, kad stulpeli� ir eilu�i� pa-
vadinimai b�t� paimti iš pirmos „Excel“ eilut�s bei stulpelio.
Paspaudus „OK“, atsidaro reikiamas failas.
27
2 užduotis Duomen� analiz� Kiek mažalapi� liep� augo skirtingose gatv�se? Nustatykite pažeis-t� medži� procent� atskirose gatv�se. Ar visose gatv�se pažeidim� dažnis vienodas? Gautus rezultatus pateikite grafiškai.
Pagrindiniame meniu pasirenkame komand� „Statistics“, kurioje ieškome komandos „Basic Satistics/Tables“. Toliau renkam�s „Breakdown & one-way ANOVA“ ir spaudžiame „OK“. Naujai atsida-riusiame lange spaudžiame „Variables“.
M�s� priklausomi kintamieji yra: „PERIMETR“, „SAUSOS“, „DEF13“, „VISA_LAJ“ ir „DECROMA“, o grupuojamasis – „GATVE“. Juos pasirink� spaudžiame „OK“.
Gr�ž� � komandin� lang�, spaudžiame mygtuk� „Codes for gruoping variables“ ir pažymime „All“. Spaudžiame „OK“, o gr�ž� � komandin� lang� spaudžiame dar kart� „OK“.
Analiz�s lange pasirenkame lap� „Descriptives“. Pasižymime statis-
tikas, kurias nor�sime skai�iuoti: liep� skai�i� (Valid N), vidurkio stan-dartin� paklaid� (std. err. of mean). Pasirink� spaudžiame „Summary“.
28
Skai�iavim� atsakymas pateikiamas naujame lange (Workbook*),
kur� galime išsaugoti kaip nauj� skai�iavim� rezultat� fail�. Vis� toles-ni� skai�iavim� rezultatai bus talpinami šiame faile tol, kol j� uždarysi-me. Lange matome, kiek kiekvienoje gatv�je išmatuota liep� (N) bei koks kiekis procentais buvo saus� šak�, defliacijos, ir dechromacijos vidutin� dyd� procentais.
Norint grafiškai pateikti gautus rezultatus, reikia gr�žti � skai�iavim� lang� „Statistics by groups -...“, tod�l pasirenkame mygtuk� „Categorized box & whisker plot.“
29
Naujai atsidariusiame lange renkam�s kintamuosius: „PERIMETR“, „SAUSOS“, „DEF13“, „VISA_LAJ“ ir „DECROMA“.
Spaudžiame „OK“. Grafikai pateikiami atsakym� lange. Sutvarkome grafik� aprašus.
3 užduotis �vertinkite medži� virš�ni� pakenkimo dažn� skirtingose gatv�se. Pagrindiniame meniu pasirenkame komand� „Statistics“, kurioje
ieškome komandos „Basic Satistics/Tables“. Toliau renkam�s „Tables and banners“.
Paspaudus „Specify tables (select variables)“ renkam�s kintamuo-sius: atsidaro pasirinkimo langas, kurio pirmame stulpelyje rankam�s „GATVE“, o antrame –„VIRSUNES“
Spaudžiame „OK“, dar kart� „OK“. Naujai atsidariusiame lange „Options“ lape pirmiausia pasižymime, kad b�t� skai�iuojamas eilu�i� dažnis procentais, ir spaudžiame „Summary“.
30
Atsakymas pateikiamas skai�iavim� faile.
Pavyzdžiui, Vasario gatv�je pakenkt� virš�ni� kiekis yra 41,15 %,
sveik� – 58,82 %. 4 užduotis �vertinkite, ar visose gatv�se liep� der�jimo dažniai vienodi?
Norint atlikti ši� užduot�, reikia kartoti tre�ios užduoties nurodymus, tik renkantis kintamuosius vietoj kintamojo „virsunes“ reikia pasirinkti „derejimo“.
5 užduotis �vertinkite tirt� medži� vidutin� saus� šak� procent�, vidutin� 1/3 ir
visos lajos defliacij� bei vidutin� dechromacij�. Atlikite nurodytos gat-v�s skai�iavimus. Pavyzdžiui, Vasario gatv�s.
Pagrindiniame meniu pasirenkame komand� „Statistics“, kurioje ieškome komandos „Basic Satistics/Tables“. Toliau „Descriptive statsitics“ ir „OK“.
Toliau v�l renkam�s kintamuosius „Variables“. Spaudžiame „OK“. Renkam�s mygtuk� „Select Cases“:
31
Naujai atsidariusiame lange dedame varnel� prie „Enable Selection
Conditions“ ir viršutiniame s�lyg� lange užrašome: v1=“vasario“. Spaudžiame „OK“.
Gr�ž� � komand� lang�, renkam�s „Advanced“ lap� ir jame žymime
reikiamas statistikas, vidurk� ir vidurkio standartin� paklaid�. Spau-džiame „Summary“.
32
Rezultatai pateikiami atsakym� lange:
Viršutin�je lango dalyje pasižymime, kad tai Vasario gatv�s liep�
b�kl�s rodikli� statistikos. 6 užduotis Ar vis� gatvi� vidutin�s kiekybinio rodiklio (saus� šak� kiekio, 1/3
bei visos lajos defliacijos, dechromacijos) reikšm�s vienodos? Atsaky-mui pagr�sti taikykite dispersin� analiz�.
Pagrindiniame meniu pasirenkame komand� „Statistics“, kurioje ieškome komandos „ANOVA“.
Antrasis žingsnis:
33
Paspaudus „OK“, atsidaro naujas langas, kuriame renkam�s kinta-muosius „Variables“ kaip nurodyta žemiau, ir spaudžiame „OK“.
Naujai atsidariusiame lange spaudžiame mygtuk� „All effects“: Skai�iavim� rezultatai pateikiami atsakym� lange:
Dispersin�s analiz�s rezultatas rodo, kad „GATVE“ kaip veiksnys
statistiškai patikimai keit� liep� saus� šak� kiek�, kadangi, „ANOVA“ (dispersin�s analiz�s) „p“ reikšm� mažesn� už 0,05. Tad atsakymas � klausim�: saus� šak� kiekis skirtingose gatv�se skyr�si.
Kartodami šioje užduotyje pateiktus žingsnius (pasirink� vis kit� kintam�j�), atsakykite, ar 1/3 ir visos lajos defliacijos bei dechromacijos skirtingose gatv�se buvo vienodos.
7 užduotis Remdamiesi visais jau gautais analiz�s rezultatais, sugrupuokite
gatves � maž�, vidutini� ir dideli� pažeidim� rajonus. Klausimai savikontrolei: Kas yra porin� dažni� lentel�? Kas yra vienfaktor� dispersin� analiz�?
34
4 l a b o r a t o r i n i s d a r b a s Dispersin� duomen� analiz�
Darbo tikslas Naudodami dispersin�s analiz�s metodus, atlikite tyrimo apie skirtin-
gos oro temperat�ros, aplinkos r�gštumo ir sunkiojo metalo (kadmio) kompleksin� poveik� pomidorams duomen� analiz�. �vertinkite, ar tirti veiksniai kiekvienas atskirai bei bendrai dar� statistiškai reikšming� �tak� pomidor� augimui (diametrui ir aukš�iui).
Teorija Dispersin� analiz� yra statistinis metodas, naudojamas tyrim�
rezultatams, priklausantiems nuo vienu metu veikian�i� skirting� faktori�, apdoroti. Dispersin� analiz� padeda nustatyti svarbiausius faktorius ir �vertina j� poveik� tiriamam kiekybiniam kintamajam (atsakui). Galima išskirti kelias dispersin�s analiz�s r�šis: vienfaktor�, dvifaktor�, daugiafaktor�.
Dispersin� analiz� užsienio literat�roje dažniausiai žymima sutrum-pintai ANOVA (ANalysis Of VAriance). Vienfaktor� dispersin� analiz�, arba F kriterijus, naudojama hipotez�ms apie dviej� ar daugiau populiaci-j� vidurkius tikrinti. Kai lyginame dviej� populiacij� vidurkius – F kriteri-jaus ir t kriterijaus (naudojamo dviej� vidurki� skirtumo hipotezei tik-rinti) – išvados sutampa. Tod�l dispersin� analiz�, arba F kriterijus, tai-koma tik prireikus palyginti daugiau kaip dviej� populiacij� vidurkius.
Dispersin�s analiz�s reikalavimai: nagrin�jamo kiekvienos populia-cijos kiekybinio rodiklio skirstinys normaliai pasiskirst�s ir turi tur�ti t� pa�i� dispersij�.
Atliekant vienfaktor� ir dvifaktor� dispersin� analiz�, statistiniame pakete „Statistica“ pateikiami šie skai�iavim� rezultatai: kvadrat� sumos SS, j� laisv�s laipsniai, dispersijos �2 �ver�iai vidutiniai kvadratai MS, F kriterijus ir jo p reikšm�. Jei p viršija parinkt� reikšmingumo lygmen� , tuomet nulinei hipotezei neprieštaraujame, t. y. teigiame, kad „remda-miesi tyrim� duomenimis, neturime pagrindo teigti, jog faktorius daro reikšming� poveik� kiekybiniam kintamajam“. Jei p , tuomet nulin� hipotez� atmetame, t. y. tvirtiname, kad „faktorius daro patikim� poveik� kiekybiniam kintamajam“.
Atlikti daugiafaktorei dispersinei analizei statistiniame pakete „Sta-tistica“ pateikiami šie skai�iavim� rezultatai: Wilks lambda, F kriterijaus
35
statistika, laisv�s laipsniai ir kriterijaus p reikšm�. Wilks lambda – kie-kybinis F kriterijaus �vertis, kuris nurodo veiksnio �takos stiprum�. Wilks lambdos reikšm� kinta nuo 0 iki 1; juo reikšm� ar�iau 1, juo stipresn� �tak� veiksnys ar j� derinys daro priklausomiems kintamiesiems. Kaip ir vienfaktor�s ar dvifaktor�s analiz�s atvejais: jei F kriterijaus reikšm� p , tuomet nulin� hipotez� atmetame, t. y. tvirtiname, jog „faktorius ar j� derinys daro reikšming� poveik� kiekybiniams kintamiesiems“, o fakto-ri� �takos stiprum� nusako Wilks lambdos reikšm�.
Duomenys analizei Duotas duomen� failas „Pomidorai kompleksinis pov.STA“, ku-
riame suvesti duomenys apie pomidor� daig� aukšt� ir diametr�, esant skirtingoms augimo s�lygoms. Kintam�j� aprašo lange „Vars“/„All Specs....“ rasite informacij� apie š� fail�.
Trumpas eksperimento aprašymas: Bandym� tikslas – ištirti kompleksin� skirting� temperat�r� ir skir-
tingo substrato r�gštingumo bei toksinio metalo kadmio poveik� pomi-dor� populiacijos augimui. Tyrimai atlikti reguliuojamomis temperat�-ros ir substrato r�gštingumo s�lygomis, tirta po tris temperat�ros ir r�gš-tingumo variantus (vienas – optimalios s�lygos, kiti du – pesimalios), papildomai buvo tiriamas toksinio metalo – kadmio poveikis. Optimali augimo temperat�ra 20,5 0C (2 augimo kamera), žema – 11,5 0C (3 kame-ra) ir aukšta – 31,5 0C (1 kamera). Optimalus durpi� substratas – 6,5 pH (duomen� faile kodas yra 0), pesimalus r�gštus – 4,0 pH (kodas – 1) ir pesimalus šarminis – 8,5 pH (kodas – 2). Sunkiojo metalo poveikiui vertinti pasirinktas 3 mg/kg kadmio kiekis dirvožemyje (kodas – 1, kontrol� – 0). Pomidorai auginti 6 savaites, paskutin� eksperimento dien� išmatuotas j� stieb� aukštis (H_6) ir stieb� diametro plotis (D_6). Ban-dymo metu tirta 18 variant� (54 bandiniai), kuriuose augo 486 pomidorai.
Darbo eiga 1 užduotis a. �vertinkite, ar temperat�ra, substrato r�gštumas ir kadmio tarša dar� �tak� pomidor� diametro kitimui, ar pomidor� diametro vidur-kio skirtumai statistiškai reikšmingi?
Programos „Statistica“ pagrindiniame meniu renkam�s komand�
„Statistics“, paskui „ANOVA“. Toliau „Main effects ANOVA“, kadangi analizuosime keli� veiksni� poveik� diametrui.
36
Spaudžiame „OK“ ir renkam�s kintamuosius „Variables“: Pirmame kintam�j� pasirinkimo lange kair�je renkam�s m�s� ana-
lizuojam� kintam�j� „D_6“ „Dependent variable list:“, dešin�je – veiksnius „Categorical predictors (factors):“ – KAMERA (skirtingos temperat�ros), SUBSTRATAS ir Cd_POVEIKIS.
Spaudžiame „OK“. Naujai atsidariusiame lange v�l spaudžiame „OK“. Šiame lange galima pasirinkti, kokio tipo dispersin�s analiz�s atsa-
kym� norime gauti; jeigu reikia lentel�s ir grafik�, spaudžiame „All ef-fects/Graphs“. Kadangi mums reikia tik dispersin�s analiz�s rezultat� lentel�s, renkam�s „All effects“.
Atsakymas pateikiamas skai�iavim� atsakym� lange:
Šiame lange pateikiama „SS“ – kvadrat� sumos, j� laisv�s laipsniai,
vidutiniai kvadratai, F kriterijus ir jo p reikšm�. Kaip matome, esant vis� min�t� veiksni� poveikiui, F kriterijaus p reikšm� yra mažesn� už 0,05, taigi darome išvad�, jog skirtingos temperat�ros, skirtingi substratai ir kadmio tarša statistiškai iš esm�s tur�jo �takos pomidor� diametro storiui.
Atsakymus galima pagr�sti grafikais, kuriuos programa pateiks ana-liz�s lange pasirinkus komand� „All effects/Graphs“.
Atsidariusiame lange renkam�s, pavyzdžiui, „KAMERA“ eilut� ir spaudžiame „OK“ – taip gauname skirting� temperat�r� poveikio pomi-dor� diametro vidurkiams grafik�.
V�l pasirinkus „All effects/Graphs“ ir jau „SUBSTRATAS“ ar „Cd_POVEIKIS“, bus pateikiami ir skirtingo substrato bei kadmio tar-šos poveikio pomidor� diametrams grafikai.
37
KAMERA; LS MeansCurrent effect: F(2, 463)=55,323, p=0,0000
Effective hypothesis decompositionVertical bars denote 0,95 confidence intervals
1 2 3
KAMERA
36
37
38
39
40
41
42
43
44
45
46
47
D_6
: mat
uota
00.
10.1
0
SUBSTRATAS; LS MeansCurrent effect: F(2, 463)=20,599, p=,00000
Effective hypothesis decompositionVertical bars denote 0,95 confidence intervals
0 1 2
SUBSTRATAS
37
38
39
40
41
42
43
44
45
D_6
: mat
uota
00.
10.1
0
Cd_POVEIKIS; LS MeansCurrent effect: F(1, 463)=54,540, p=,00000
Effective hypothesis decompositionVertical bars denote 0,95 confidence intervals
0 1
Cd_POVEIKIS
38
39
40
41
42
43
44
45
46
D_6
: mat
uota
00.
10.1
0
Kaip matome iš pateikt� grafik�, pomidor� diametr� vidurkiai skir-
tingose kamerose (temperat�ros poveikis) skiriasi statistiškai iš esm�s, nes nepersikerta j� 95 % tikimyb�s pasikliautiniai intervalai. Skirtinguo-se substratuose statistiškai reikšmingas skirtumas tarp pomidor� augusi� neutralioje (0) ir r�gš�ioje (1) bei šarmin�je (2) ir r�gš�ioje (1) diametr�. Tarp neutralioje ir šarmin�je terp�se augusi� pomidor� diametr� statis-tiškai reikšmingo skirtumo nebuvo. Kadmio tarša (Cd_poveikis – 1) statistiškai patikimai veik� pomidor� diametro kitim�.
b. �vertinkite, ar temperat�ra, substrato r�gštumas ir kadmio tarša statistiškai patikimai veik� pomidor� aukš�io kitim�?
Norint atlikti užduot�, reikia kartoti tuos pa�ius žingsnius kaip ir 1 užduoties a dalyje, tik analizuojam� kintam�j� „Dependent variable list:“ lange renkam�s ne diametr� D_6, o aukšt� H_6.
2 užduotis �vertinkite skirtingos oro temperat�ros ir skirtingo substrato poveik�
pomidor� diametrui ir aukš�iui. Kas labiau veik� pomidor� augim�: temperat�ra ar substrato r�gštumas?
Pagrindiniame programos meniu renkam�s „ANOVA“, paskui „Main effects ANOVA“, nes v�l analizuosime keli� veiksni� poveik�.
Pirmame kintam�j� pasirinkimo lange kair�je „Dependent variable list:“ renkam�s du analizuojamus kintamuosius „D_6“ ir „H_6“, o deši-n�je – veiksnius „Categorical predictors (factors):“ – KAMERA (skir-tingos temperat�ros) ir SUBSTRATAS.
Spaudžiame „OK“. Toliau renkam�s „All effects“.
38
Remdamiesi skai�iavim� rezultatais, galime teigti, kad tiek substratas,
tiek temperat�ra statistiškai reikšmingai veik� pomidor� augimo kitim�. Atsakym� lange pateikiama Wilks lambda („Wilks test value“)
reikšm� rodo, jog substratas dar� gerokai didesn� �tak� pomidor� aukš-�iui ir diametrui nei skirtinga temperat�ra (0,17<0,78).
3 užduotis Kaip pomidor� augim� veik� skirtingos temperat�ros ir kadmio tar-
ša esant optimaliam pH 6,5 substratui? Koki� �tak� dar� suminis kadmio taršos ir skirting� temperat�r� poveikis?
Nor�dami �vertinti ne tik atskir� veiksni� (kadmio taršos ir tempera-t�ros) poveik�, bet ir j� sumin� poveik�, „ANOVA“ analiz�s lange turime rinktis „Factorial ANOVA“ dispersin�s analiz�s tip�.
Toliau b�tina užrašyti s�lyg�, jog analizuosime tik pomidorus, au-
gusius optimaliame substrate pH 6,5. Kadangi duomen� faile optimalus substratas koduojamas „0“, s�lyg� užrašome taip: „substratas=0“.
39
Paspaud� „OK“, renkam�s „Variables“: „Dependent variable list“, pažymime „D_6“ ir „H_6“, o „Categorical predictors (factors):“ – „KAMERA“ ir Cd_POVEIKIS“.
Toliau renkam�s „All effects“. Atsakymas pateikiamas rezultat� lange:
Atsakym� lentel�s paskutin�je eilut�je (KAMERA*Cd_POVEIKIS) pateikiamos suminio skirting� temperat�r� ir kadmio taršos poveikio vertinimo statistikos: Wilks lambdos reikšm� 0,9 rodo, jog suminis po-veikis labiausiai veik� pomidor� augimo parametrus ir statistiškai reikšmingai (p<0,05). � pirm�j� užduoties klausim� atsakote remdamiesi teorine dalimi bei antros užduoties komentarais.
Atsakymus galima pagr�sti grafikais, kurie bus pateikti analiz�s lan-ge pasirinkus „All effects/Graphs“.
Pvz., pasirinkus:
Toliau: ir toliau:
40
Grafikas pateikiamas atsakym� lange: KAMERA*Cd_POVEIKIS; LS Means
Wilks lambda=,90400, F(4, 310)=4,0112, p=,00346Effective hypothesis decomposition
Vertical bars denote 0,95 confidence intervals
Cd_POVEIKIS0 Cd_POVEIKIS1
1 2 3
KAMERA
32
34
36
38
40
42
44
mat
uot
46
48
50
52
54
D_6
:a
00.1
0.10
Kaip matome iš grafiko, esant optimaliam substratui pH 6,5, visose
kamerose (temperat�ros poveikis) kadmio tarša statistiškai reikšmingai mažino pomidor� diametro vidurkius. Kai kadmio taršos nebuvo, pomi-dor� diametrai neutraliame substrate kito taip: mažiausi aukštoje tempe-rat�roje, o storiausi – žemoje. Atsiradus kadmio taršai, labiau išsiskyr� (žymiai suplon�jo) aukštoje temperat�roje augusi� pomidor� diametrai, o optimalioje ir aukštoje išliko apytiksliai lyg�s.
4 užduotis Kaip veik� pomidor� augim� kadmis, esant r�gš�iam pH 4,0 sub-
stratui bei skirtingoms temperat�roms?
Užduot� atlikite kaip tre�i�j�, skiriasi tik užrašoma s�lyga lange.
Remdamiesi analiz�s rezultatais, parašome išvadas, t. y. atsakymus � pateiktus klausimus.
5 užduotis Kaip veik� pomidor� augim� kadmis, esant optimaliai 20,5 0C tem-
perat�rai bei skirtingiems substratams? Nor�dami gauti atsakym� � pateikt� klausim�, atliekame faktorin�
dispersin� analiz� „Factorial ANOVA“ kaip ir 3 užduotyje. Skiriasi tik
lange užrašoma s�lyga (kamera=2) bei kintam�j� pasirinkimas.
41
Rin etr� ir aukšt� priklausom� kintam�j� lange, o substrat� ir kad
dispersin�s analiz�s rezultatus.
poveik� pomidor� augimui. Kokios augimo s�lygos buvo nepalankiau-sios pom
perimento pabaigoje?
dispersin� analiz� kaip ir 3 užduotyje. Skiriasi tik kintam�j� pasirinki-mas m�s diametr� ir aukšt� priklausom� kintam�j� lange „De
ksim�s diamm� – faktori� lange. Pakomentuojate gautus grafikus bei 6 užduotis �vertinkite kompleksin� temperat�r�, substrato r�gštumo ir kadmio
idorams augti? Kokios palankiausios? Kurios aplinkos veiksni� kombinacijos statistiškai reikšmingai veik� pomidor� augim�, t. y. dia-metro ir aukš�io dyd� eks
Nor�dami gauti atsakym� � pateikt� klausim�, atliekame faktorin�
, t. y. rinksipendent variable list:“ o kamer�, substrat� ir kadm� – faktori� „Ca-
tegorical predictors(factors):“ lange.
Patikriname, ar lange teb�ra užrašyta s�lyga; jei yra, tuo-met išjungiame taip:
Pakomentuojate gautus grafikus bei dispersin�s analiz�s rezultatus.
Atsakome � pateiktus klausimus. Klausimai savikontrolei: Kada naudojama dispersin� duomen� analiz�? Kokie gali b�ti dispersin�s analiz�s tipai? Kas pateikiama „ANOVA“ analiz�s atsakym� lange? Kas yra F kriterijus, SS, MS bei Wilks lambda?
42
5 l a b o r a t o r i n i s d a r b a s duomen� analiz�
Darbo tikslas Naudodami koreliacin�s duomen� analiz�s metodus, �vertinkite au-gal� augimo parametr� koreliacin� ryš�, esant skirtingoms augimo s�lygoms.
Teorija Tiesin� priklausomyb� tarp dviej� kiekybini� kintam�j� vadinama
koreliacija. Šios tiesin�s priklausomyb�s, arba koreliacijos matas yra koreliacijos koeficientas, žymimas r. Tai bedimensinis dydis, kintantis nuo –1 iki +1. Jei r lygus 1 ar –1, tarp kintam�j� yra tiesin� priklauso-myb� (r = 1 – did�jant X, did�ja Y; r = –1 – did�jant X, maž�ja Y), kuri� galima išreikšti tiesine lygtimi: Y = aX + b. Jei tarp X ir Y vienas nuo kito nepriklauso, tuomet r = 0.
Jei did�jant X maž�ja Y, tuomet r < 0, be to, kuo glaudesn� X ir Y priklausomyb�, tuo r ar�iau –1, arba |r| didesnis. Koreliacijos koeficien-tas neatspindi nemonotonin�s priklausomyb�s. Nors tarp kintam�j� yra labai glaudi netiesin� priklausomyb�, koreliacijos koeficientas gali b�ti artimas nuliui.
Kintam�j� tiesinei priklausomybei vertinti naudojami Pirsono ir Spirmeno koreliacijos koeficientai. Pirsono koreliacijos koeficientui skai�iuoti naudojamos kiekybini� kintam�j� reikšm�s. Spirmeno kore-liacijos koefientas skai�iuojamas naudojant ne išmatuotas kintam�j� reikšmes, o j� rangus – eil�s numer� variacin�je sekoje. Tod�l Spirmeno koreliacijos koeficientas vadinamas ranginiu. Kur� koreliacijos koefi-cient� panaudoti sprendžiame remdamiesi turimu kintam�j� modeliu.
Sakoma, kad tarp kintam�j� yra silpnas ryšys, jei |r| 0,3; viduti-nio stiprumo ryšys, jei 0,3 < |r| 0,6, stiprus ryšys, jei |r| > 0,6. Ryšio tarp kintam�j� glaudumo matui naudojamas ir koreliacijos koeficiento kvadratas r2.
Tiesin� vieno kintamojo regresija – papras�iausias regresinis mode-lis. Tiesin�s regresijos modelyje daroma prielaida, kad tarp atsako ir faktoriaus iš tikro yra funkcinis ryšys Y = + �X, ta�iau tikslios koefi-cient� ir � reikšm�s nežinomos – yi reikšm� matuojama su paklaida �i,
Koreliacin� ir paprastoji tiesin�
43
turin�ia normal�j� ime homoskedas-tišk š-m�ms e-dastiški.
x vadinama regresijos tiese; ir � – ties�s paramet-rai. �x a s regr ntu. � parodo, kiek pakinta y, kai x pakinta vienetu. Jei � teigiamas, tuomet did�jant x did�ja ir y, o jei � neigiamas, tuomet did� ž�ja y. Kuo � absoliu�iu dydžiu didesnis, tuo ties� staigiau kyla
skirstin�. Šiame modelyje apsiribosais duomenimis, t. y. Y dispersija vienoda visoms faktoriaus reik
. Jei Y dispersija yra x funkcija, sakoma, kad duomenys heterosk
Ties� y = + � yra lygties laisvasis narys (intercept); – atkarpa, kuri� ties� +tkerta Y ašyje. � yra ties�s krypties koeficientas (slope), vadinamaesijos koeficie
jant x ma ar leidžiasi. Regresijos ties�s + �x �vertis yra a + bx. Visai regresijos tiesei taip
pat nustatoma pasikliautina sritis. Dydžiai ii bxay ��ˆ yra atsako reikšm�s, �vertintos regresiniu modeliu. Skirtumai tarp atsako faktini� ir modeliuot� reikšmi� ei = yi – iy = yi – ( �a bxi) vadinami liku�iais (residual). Liku�i� analiz� padeda �vertinti modelio adekvatum� – atitikim� realius duomenis.
Kai programa „Statistica“ pateikia mums regresin� kreiv� bei jos parametrus, kyla klausimas, ar regresin� kreiv� gerai atitinka eksperi-mentinius duomenis. Vienas svarbiausi� tinkamumo mat� vadinamas determinacijos koeficientu. Determinacijos koeficientas žymimas R2 ir apibr�žiamas santykiu: regresinio nuokrypio kvadrat� suma (KSR) / ben
r-min
dro nuokrypio kvadrat� suma (KSB). Determinacijos koeficientas kinta nuo 0 iki 1. Kuo R2 ar�iau vieneto, tuo regresin� kreiv� geriau tinka eksperimentiniams duomenims. Pavyzdžiui, kai R2=0,7, galime teigti, kad 70 % y variacijos paaiškinama nepriklausomu kintamuoju x.
Regresin� analiz� glaudžiai susijusi su koreliaciniais analiz�s meto-dais. Koreliacijos tarp kintam�j� stiprumo matas yra koreliacijos koefi-cientas. Jis žymimas R ir apibr�žiamas kaip kvadratin� šaknis iš dete
acijos koeficiento R2. Kuo R yra ar�iau 1 ar –1, tuo stipresnis kore-liacinis ryšys sieja nagrin�jamus kintamuosius.
Duomenys analizei Duotas duomen� failas „koreliacija.sta“, kuriame pateikti duomenys
apie pomidor� augimo parametrus (diametr�, aukšt� iki virš�n�s, aukšt� su lapais, lajos plot� ir didžiausio lapo ilg�), eksperimento pabaigoje esant skirtingiems augimo tankumams (nuo 35 iki 340 indiv./m2).
44
Darbo eiga 1 užduotis Paskai�iuokite, koks koreliacinis ryšys tarp skirting� pomidor� au-gimo parametr�? Kaip min�tus parametrus veikia skirtingas tanku-mas? �vertinkite koreliacijos koeficient� patikimumo lyg�. Kurios koreliacijos yra stipriausios, o kurios silpniausios? Pagrindiniame meniu pasirenkame komand� „Statistics“, kurioje
ieškome komandos „Correliation matrices“, ir spaudžiame „OK“. Naujai atsidariusiame lange spaudžiame „One variable lists“ ir pasi-
renkame visus kintamuosius. Toliau atsidarome „Options“ lap� ir jame pažymime, kad mums atsakym� lange pateikt� ne tik koreliacijos koefi-cient� „r“, bet ir jo patikimumo lyg� „p“. Spaudžiame „Summary“.
Rezultatai pateikiami atsakym� lange:
45
Visi paskai�iuoti koreliacijos koeficientai yra statistiškai reikšmingi, nes yzdžiui, tarp pomidor� didžiausio lapo ilgio ir diametro nustryšynio dor�
emdamiesi teorine dalimi ir gautais skai�iavim� rezultatais, atsa-kyk
Koreliacini� matric� analiz�s lange pasirenkame „Advenced/plot“
lap� ir spaudžiame „2D scatterplots“ mygtuk�.
Toliau renkam�s kintamuosius: „First (horizontal) variable list:“ lange pažymime kintam�j� „Diametras“, o „Second (vertical) variable list:“ – „Didziausio lapo ilgis“.
Spaudžiame „OK“. Grafikas pateikiamas atsakym� lange:
p<0,05. Pavatytas statistiškai reikšmingas labai stiprus teigiamas koreliacinis s (koef. reikšm� – 0,89). Tarp augimo tankumo ir aukš�io – viduti-stiprumo neigiamas koreliacinis ryšys, t. y. did�jant tankumui pomi- aukštis maž�ja. Rite: Koki� kintam�j� koreliacija pati stipriausia? Koki� kintam�j�
koreliacija silpniausia? 2 užduotis Pateikite pomidor� diametro ir didžiausio lapo ilgio priklausomyb�s grafik�.
Did�jant pomidor� diametrui, ilg�ja ir lapai. Paveiksle pateikiama ir šios priklausomyb�s lygtis bei koreliacijos koeficiento reikšm�.
46
3 užduotis Paskai�iuokite, koks koreliacinis ryšys sieja pomidor� augimo pa-rametrus, esant didžiausiam ir mažiausiam augimo tankumams? �vertinkite koreliacijos koeficient� patikimumo lyg�. Atlikdami ši� užduot�, kartojame tuos pa�ius žingsnius kaip ir pir-
moje užduotyje, tik � skai�iavimus ne�traukiame tankumo, o papildomai dar parašome s�lyg� (3 žingsnis).
Skai�iuodami tankiausiai augusi� pom
ficientus, „Select Cases“ lange renkam�idor� parametr� koreliacijos
koe s „Enable Selection Condi-tions“, paskui užrašome s�lyg� „tankumas=340“ (taip programai nuro-dome � skai�iavim� �traukti tik 340 indiv./m2 augusius pomidorus). Spaudžiame „OK“, o gr�ž� � ankstesn� lang� spaudžiame „Summary“.
47
Rezultatai pateikiami atsakym� lange:
Skai�iuodami mažiausiu tankumu augusi� pomidor� parametr� ko-
reliacijos koeficientus, „Select Cases“ lange užrašome s�lyg� „tanku-mas=35“, o visa kita kartojame kaip buvo parodyta.
Rezultatai pateikiami atsakym� lange:
Pakomentuokite koreliacijos koeficient� reikšmes ir j� patikimumo
lyg�. Kokiu tankumu augusi� pomidor� augimo parametrai tarpusavyje
labiau koreliuoja? 4 užduotis Sudarykite pomidor� augimo parametr� priklausomyb�s regresines lygtis. (Pavyzdžiui, didžiausio lapo ilgio ir diametro priklausomyb�s lygt�.) �vertinkite regresini� lyg�i� patikimum�. Programoje „Statistica“ pasirenkame „Statistics“, „Multiple Reg-
ression“:
48
Toliau renkam�s kintamuosius „Variables“. „Dependent var. (or list for batch):“ lange renkam�s „Didžiausio lapo ilgis“, „Independent va-riable list:“ – „Diametras“ ir spaudžiame „OK“.
Nepamirštame „Select Cases“ lange panaikinti varnel�s prie „Enab-le Selection Conditions“ – taip � skai�iavim� �trauksime visus duome-nis. Spaudžiame „OK“ ir dar kart� „OK“.
Naujai atsidariusiame lange spaudžiame „Summary: Regression
results“.
Atsakym� lange „B“ stulpelyje matome ties�s lygties koeficientus
bei j� patikimum� „p-level“, o regresinio modelio tinkamum� atspindi dete inacijos koeficientas R2 – 0,79638896. Tad apie 80 % pomidor� didž auga ilgesni did�jant diametrui pagal sudaryt� lygt�. Kaio skresi
cientus bei patikimumo lyg�.
rmiausi� lap�
p matome, lygtis, pateikta antros užduoties paveiksle, ir ši sutampa, irtumas tik tas, kad ankstesn�je užduotyje negal�jome �vertinti reg-
n�s lygties patikimumo lygio. Analogiškai galime paskai�iuojame ir kit� pasirinkt� parametr�
lyg�i� koefi
49
5 užduotis Remdamiesi pomidor� lapo ilgio priklausomyb�s nuo diametro reresijos lygtimi, apskai�iuokite lapo ilg�, jei d
g-iametras b�t� 16 mm ir
i skai�iuotuvu. itas b�das tai atlikti – naudoti program� „Statistica“. Tam rei-
kia atsidaryti regresin�s analiz�s komandin� lang� „Multiple Regres-sion Results: ....“, kuriame skai�iuojama didžiausio lapo ilgio ir diametro priklausomyb�s lygties koeficientai. Toliau renkam�s „Re-sults/assumptions/prediction“ lap�, o jame spaudžiame „Predict de-pendent variable“.
Naujai atsiradusiame lange �rašome diametro stor�, pvz., 16 (Dia-metras „16“) ir spaudžiame „OK“.
Atsakymas:
57 mm.
Šia užduot� galima atlikti keliais b�dais. Vienas j� – surašyti rei-kiamas „X“ reikšmes � lygtis ir suskai�iuot
K
16 mm stiebo storio pomidor� lap� ilgis svyruot� nuo 80,843 iki
139,237, o vidurkis – 110,04 mm. alogiškai paskai�iuojame teorin� pomidor� lap� ilg�, ka stiebo
storis An i
– 57 mm. Palyginkite, kuris teorinis skai�iavimas tikslesnis? Kod�l? Klausimai savikontrolei: Kas yra koreliacija? Koks gali b�ti koreliacijos koeficientas? Kas atspindi regresin�s ties�s „gerum�“?
50
6 l a b o r a t o r i n i s d a r b a s
iojo prieaugio indekso reikšm�s pri-klau m�nesio vidutin�s temperat�ros: did�jant vidutinei ko-vo m�nesio temperat�rai, turi tendencij� did�ti ir radialiojo prieaugio indekso reikšm�. Šiuo atveju faktorius, arba nepriklausomas, kintamasis X yra kovo m�n. vidutin� temperat�ra, o atsako, arba priklausomas, kin-tamasis Y yra radialiojo prieaugio indeksas. Atsak� gali veikti keletas faktori� (pvz., keli� m�nesi� temperat�ra ar krituli� kiekis) X(1), X(2), ..., X(k); taigi faktorius X gali b�ti ir daugiamatis: X = (X(1), X(2), ..., X(k)). Atsako priklausomybei vertinti naudojami regresiniai modeliai, kurie gali b�ti:
- tiesin� vieno kintamojo regresija (papras�iausias regresinis mo-delis),
inis dau-gial
cijos parametrai apskai�iuojami kaip ir tiesi iuose paketuose pateikiami regresijos koe aidos; taip pat pateikiamas ir atsi
i vertinti ir keliems regresi-niams modeliams palyginti skai�iuojamas determinacijos koeficientas R2, rodantis, kuri� atsako dispersijos dal� s�lygoja tiesin� k faktori� �ta-
Tiesin� priklausomyb�
Darbo tikslas Naudodami tiesin�s regresijos metodus, nustatykite klimato rodikli� (vidutini� m�nesio temperat�r� bei krituli� kiekio) �tak� medži� ra-dialiojo prieaugio indekso kitimui.
Teorija Regresin�je analiz�je priklausomas kintamasis b�na tas, kurio elges�
norime išsiaiškinti, o nepriklausomas – kuriuo bandome aiškinti priklau-somojo poky�ius. Tiek aplinkotyros, tiek ir kituose biomedicinos moks-luose kai kuriuos kintamuosius galima laikyti atsaku � veikiant� vien� ar kelis faktorius. Pavyzdžiui, radial
so nuo kovo
- svorio regresija, - keli� kintam�j� (daugialyp�) tiesin� regresija. Jei tarp ši� faktori� ir Y konstatuojamas tiesinis ryšys, o suminis
faktori� poveikis atsakui išreiškiamas tiesine faktori� kombinacija, tai Y priklausomybei nuo X modeliuoti dažniausiai naudojamas ties
�s regresijos modelis. ypNežinomi regresijos funk
atistinn�s regresijos. Stficient� � �ver�iai b, j� standartin�s pakl
2tiktin�s paklaidos dispersijos �vertis 0s . Daugialyp�s regresijos modelio kokybe
51
ka. Kuo daugiau k desnis R2. R2 yra atsitiktinis dydis, tod ali b�ti gauta atsi-tiktinai, nors iš tikro i kšmingumui (tie-sin� faktori� kombinacija mažina atsako kintamum�) tikrinti statisti-niuo ai�iuojama F kriterijaus p reikšm�. Jei p > 0,05 – regr
liacikorel ikšmi� ir modeliuot� reikšmi� mod
žingsninis (Forward Stepwise) ir kintam�j� Visi šie metodai
pagr
o
intam�j� �traukta � model�, tuo di�l palyginti nemaža jo reikšm� g� ir Y dispersijos R2 rei nesiskiria.
se paketuose skesinis modelis naudoti netinkamas. Šaknis iš determinacijos koeficiento R vadinama daugialypiu kore-jos koeficientu. Konkre�ios imties atveju R reikšm� lygi Pirsono iacijo koeficiento tarp atsako res
uliui. Optimaliu laikytinas toks daugialyp�s regresijos modelis, kurio
AdjR2 yra didžiausias. Sudaryti optimal� model� sud�tinga, jei faktori� skai�ius k n�ra mažas. Pavyzdžiui, naudojant 6 faktorius, galima sudary-ti 26 – 7 = 57 skirtingus modelius. Tod�l konstruojant daugialyp�s regre-sijos model� b�tina apsiriboti tik faktoriais (kintamaisiais), susietais su atsaku biologine prasme bei reikšmingai koreliuojan�iais su atsaku. Jei reikšmingai su atsaku koreliuojan�i� faktori� n�ra daug, modeliui suda-ryti galima naudoti ir tuos faktorius, kuri� kriterijaus, skirto tikrinti ko-reliacijos tarp Y ir X(i) reikšmingumui, p reikšm� neviršija 0,2. Regresi-nio modelio kintamieji X(i) turi b�ti tiesiškai nepriklausomi, nes kai X(i) smarkiai koreliuoti, modelio koeficient� �ver�iai b�na nestabil�s. Jei koreliacijos koeficientas tarp 2 faktori� absoliu�iu dydžiu viršija 0,8, � model� verta traukti tik vien� iš j� arba modelyje naudoti tam tikr� ši� kintam�j� funkcij�.
tOp imaliam modeliui sudaryti dažniausiai naudojami: kintam�j� �traukimo (Forward Entry), kintam�j� eliminavimo (Backward Remo-val), kintam�j� �traukimoeliminavimo žingsniniai (Backward Stepwise) metodai.
�sti žingsnine proced�ra – algoritmu, leidžian�iu palaipsniui � mode-l� �traukti „geriausi�“ kintam�j� arba (ir) pašalinti „blogiausi�“.
Duomenys analizei Duotas duomen� failas su skirting� mišk� medži� prieaugio sek�
duomenimis (failas Tiesine regresija.sta) nuo 1921 m. iki 2001 m. Ra-dikaliojo prieaugio matavimai atlikti Jonavos rajono miškuose: duome-n� faile jie pateikti nuo 13 iki 20 kintam jo, kuri� pavadinimai yra su-trumpinti mišk� pavadinimai. Pirmuose dviejuose failo stulpeliuose pa-teikta met� seka. Nuo 3 ir iki 12 kintamojo suvesti duomenys apie ap-linkos kokyb�, pvz., CO, NO, SO2 tarš� nuo 1981 m. iki 2001 m. Toliau
52
21–36 stulpeliuose pateikti mišk� radikaliojo prieaugio trendai bei in-deksai, o 37–74 stulpeliuose pateikti klimato rodikliai: TSAU, TVAS ir t. t. – m�nesio vidutin� temperat�ra kiekvienais metais; KSAU, KVAS ir t. t. – vidutinis krituli� kiekis; TPBIR, TPLIE ir t. t. – vidutin� pra�ju-si� met� m�nesio temperat�ra; KPBIR, KPLIE ir t. t. – vidutinis pra�ju-si� met� m�nesio krituli� kiekis.
Darbo eiga 1 užduotis Nustatykite, kokie klimato rodikliai patikimai koreliuoja su dend-rochronologiniais indeksais (analizuokite pasirinkto miško dend-rochronologinius indeksus, pvz., AZ2507I). Pateikite gaut� rezulta-t� interpretacij�.
Programoje „Statistica“ pasirenkame „Statistics“, „Basic Statistics
and Tables“, „Correlation matrices“ ir spaudžiame „OK“.
Pirmiausia atsidariusiame lange pasirenkame „Options“ ir pažymi-me, kad skai�iavim� lange mums rodyt� ne tik koreliacijos koeficiento reikšm�, bet ir jo patikimumo lyg�. Toliau spaudžiame „Two lists (rect. Matrix)“.
Atsidariusiame lange renkam�s kintamuosius, kair�je – klimato ro-
diklius nuo 37 iki 74, dešin�je – pasirinkto miško dendrochronologinius rodiklius (pvz., 30).
Spaudžiame „OK“.
53
Atsakym� lange matome koreliacijos koeficiento r reikšmes ir jo
patikim
ryti naudosime ir tuos klimato rodiklius, kuri� patikimu-mas neviršija 0,2. Pavyzdžiui, sausio ir rugpj��io m�nesi� vidutin�s temperat�ros su dendrochronologiniais indeksais koreliuoja nepatikimai, bet p<0,2, tad modeliui sudaryti tinka.
2 užduotis Atrinkite kintamuosius regresijos lyg�iai tarp dendrochronologini�
indeks� ir klimato rodikli� sudaryti. Pradžioje naudokite visus kinta-muosius, kuri� koreliacij� su dendrochronologiniais indeksais patiki-mumas neviršija 0,2, t. y. p<0,2).
Pvz., TSAUS, TVAS, TKOV, TRUPJ, TLAP ir t. t. 3 užduotis Naudodami atrinktus kintamuosius, �traukimo-atmetimo metodais
sud
umo lyg�. Statistiškai patikima koreliacija nustatyta tarp pasi-rinkto miško „AZ10017I“ dendrochronologini� indeks� ir vasario, kovo bei lapkri�io m�nesi� vidutini� temperat�r� (koreliacijos p<0,05). Ka-dangi reikšmingai koreliuojan�i� klimato rodikli� yra nedaug, regresijos modeliui suda
arykite optimali� dendrochronologini� indeks� priklausomyb�s nuo klimato rodikli� lygt�.
Programoje „Statistica“ pasirenkame „Statistics“, „Multiple Reg-ression“:
54
Toliau renkam�s kintamuosius „Variables“:
Kair�je lango pus�je („Dependent var. (or list for batch):“) pasiren-kame priklausom� kintam�j� „AZ10017I“, dešin�je – klimato rodiklius (nepriklausomi kintamieji) „Independent variable list:“, kuri� koreliaci-j� su dendrochronologiniais indeksais patikimumas neviršija 0,2. Pvz., „TSAUS“, „TVAS“, TKOV“, „TRUPJ“ ir t. t.
Spaudžiame „OK“. Atsidariusiame lange „Multiple Regression Results: Tiesine regre-
sija“ matome regresin�s analiz�s tarpinius rezultatus:
Spaudžiame „Summary: Regression results“. Atsakym� lange pateikiami regresin�s analiz�s rezultatai: regresin�s
ties�s parametr� reikšm�s bei j� patikimumo lygmuo „p-level“.
Iš modelio išmetame t� klimato rodikl�, kurio „p-level“ reikšm� di-
džiausia (šiuo atveju – KPGRUO). Visk� kartojame iš naujo, t. y. gr�žtame � komand� lang� ir renka-
m�s „Cancel“.
55
Toliau kintam�j� lange išmetame didžiausi� „p-level“ reikšm� tur�-jus� kintam�j� – KPGRUO (60 var).
Spaudžiame „OK“.
V�l spaudžiame „Summary: Regression results“ ir ži�rime, kurio
kintamojo „p-level“ reikšm� didžiausia. Taip kartojame tol, kol visos „p-level“ reikšm�s lieka mažesn�s už
0,05 (raudona spalva). Regresin�s analiz�s rezultatai pateikiami skai�iavim� atsakym� lange:
Parašome ties�s lygt�: Regresijos lygties koeficientai lange pateikiami „B“ stulpelyje. Lyg-
t� rašome taip:
AZ10017I= 113,7+ 1,0834*TVAS + 1.7836*TKOV – 0.1752*KGRUO
4 užduotis
nge pateiktos statistikos „Multiple R“ – kintam�j� kore-
Aptarkite sudaryto modelio „gerum�“ (R, R2 ir kitus kriterijus). Pa-teikite modelio interpretacij�.
Modelio tinkamum� apib�dina „Multiple Regression Results: Tiesi-
ne regresija“ la
56
liacijos koeficientas, R2 – determinacijos koeficientas bei p- modulio patikimumo lygmuo:
Šiuo atveju kintam�j� koreliacijos koeficientas „Multiple R“ lygus
0,54j�. Determinacijos koeficientas R lygus
0,30 miško dendrochronologini� indeks� kitimo priklauso nuo vasario ir ko-vo m�nesi� temperat�ros bei gruodžio m�nesio krituli� kiekio. Juk nat�-raliai gamtoje medži� prieaugio dyd� lemia ir daugelis kit� veiksni�, pavyzdžiui, aplinkos tarša ar saul�s radiacija.
Nor�dami dar patikrinti, ar m�s� pasirinkti X (klimato rodikliai) kintamieji tikrai daro �tak� kintamajam Y (pasirinkto miško dendrochro-nologiniai indeksai), galime atlikti dispersin� analiz�. Tam regresijos analiz�s tarpini� rezultat� lange renkam�s „Advanced“ lap�, o jame mygtuk
830333, kuris rodo vidutin� koreliacin� ryš� tarp priklausomo ir ne-priklausom� kintam� 2
063654. Koeficiento reikšm� rodo, kad tik apie 30 % pasirinkto
�
tsakymas: AM�s� pasirinkti kintamieji X – klimato rodikliai tikrai daro �tak�
kintamajam y – dendrochronologiniams indeksams, analiz�s p<0,05.
57
5 užduotis Remdamiesi gautu moduliu, paskai�iuokite, koks bus dendrochro-
nologinis indeksas, kai vasario m�nesio vidutin� temperat�ra 2 0C, kovo m�nesio – 7 0C, krituli� kiekis gruodžio m�nes� – 14 mm.
Regresijos analiz�s tarpini� rezultat� lange „Multiple Regression
Results: Tiesine regresija“ renkam�s „Residuals/assumptions/prediction“ lap�, o jame mygtuk�
�rašome temperat�r� ir krituli� kiekio reikšmes:
Atsakymas pateikiamas rezultat� lange:
Atsakymas: 125,87. 6 užduotis Grafiškai pateikite esamus ir pagal modul� paskai�iuotus dendrochro-
nolo s. Analizuokite liku�ius. ginius indeksuRegresijos analiz�s tarpini� rezultat� lange „Multiple Regression
Results: Tiesine regresija“ spaudžiame „OK“.
58
Toliau „Quick“ lape spaudžiame mygtuk� „Summary: Residuals & pred
idual“ – liku-�iai, t. y. skirtumas tarp esam� ir paskai�iuot� reikšmi�.
Columns“.
icted“. Atsakym� lange pateikiama: „Observed value“ – esami indeksai;
„Predicted value“ – paskai�iuoti pagal lygt� indeksai; „Res
Norint šiuos rezultatus pateikti grafiškai, reikia pasižym�ti juos pe-le, paskui spausti dešin�j� pel�s klaviš� ir rinktis „Graphs of Block Da-ta“, „Line Plot: Entire
Grafikas pateikiamas atsakym� lange:
nalizuodami pateikt� grafik� atsakykite: metodu sudarytas dendrochronologini� indek-
s� priklausomyb�s nuo klimato rodikli� modelis labai skiriasi nuo fakti-ni�
sudarymo metodus?
AAr tiesin�s regresijos
duomen�? Klausimai savikontrolei: Kas yra tiesin� regresija? Koki� tip� gali b�ti tiesinio ryšio regresijos? Kokius žinote daugialypi� regresini� modeli�
59
7 l a b o r a t o r i n i s d a r b a s Netiesin�s priklausomyb�s
resijos metodus, nustatykite populia-cijos tankumo �tak� pomidor� (Lycopersicon esculentum Mill.) diametro ir aukš�io kitimui eksperimento metu.
Teorija Norint suprasti proces� ir reiškini� esm�, reikia ištirti j� ryšius su
kitais procesais ir reiškiniais. Pirmiausia iškyla klausimas apie priežas-tis, s�lygojan�ias konkret� proces� ar reiškini� vyksm�. Pavyzdžiui, derlius priklauso nuo dirvos strukt�ros, tr�š� kiekio, meteorologini� s�lyg� bei augal� tarpusavio s�veikos (piktžoli�, tankumo ir t. t.). Ko ia derl ri�? – tai pagrindinis klausi-mas, � kur� tur�t� pad�ti atsakyti koreliacin� ir regresin� analiz�. Regre-sija – tai vienpus� statistin� priklausomyb�, kuri išreiškiama vadinam�ja regresijos funkcija.
Labai dažnai gyv� organizm� atsako priklausomyb� nuo juos vei-kian�i� veiksni� yra netiesin�. Daugiausia naudojamos šios netiesin�s priklausomyb�s:
a) Augimo kreiv�, išreiškianti prieaugio (Growth) priklausomyb� nuo amžiaus (Age):
Growth = exp(–b1*Age) + � (augimo modelis su adityvi�ja paklaida). Augimo kreiv� su multiplikatyvi�ja paklaida Growth = exp(–b1*Age)*� gali a ištiesinti logaritmavus tos kreiv�s lygt�: ln(Growth) = (–b1*Age) + ln�, regresijos modul�. Prieau-gio
(y) � vaist� doz� (x) kreiv� y = b0 – b0/(1 + (x/b2)b1) + �. ) Logistiniai ir „probit“ modeliai.
iuojami daugelis individe vykstan�i� bio-che apibr�žiamas taip:
analiz�s modeli� naudojimas 1 dal is
Darbo tikslas Naudodami netiesinio ryšio reg
kiaus priklausomyb� nuo pateikt� fakto
m o koeficient� b1 vertinti naudojant tiesin�s priklausomybei nuo amžiaus vertinti naudojama bendresn� augimo
kreiv�: Growth = b0 + exp(–b1*Age) + �. b) AtsakocNetiesine regresija model
mini� proces�. Netiesin�s regresijos modelis
yi = f(xi) + �i, i = 1, 2, …, n,
60
�ia xi = augiama�io fakto-riaus ir atsa ugiama�io ar-gumento funkcija
Regresijos f ind�t� biologin� ryš�, esant� tarp faktori� ir atsako. us netiesin� regresijos funkci-j� f(x), kitas modelio sudarymo etapas – �vertinti nežinomus f(x) para-met
ramduo ina-cijo imas R2 ir apibr�-žiamas santykiu: regresinio nuokrypio kvadrat� suma (KSR) / bendro nuo adrat� suma (KSB). Determinacijos koeficientas kinta nuo 0 ik
midor� daig� aukšt� ir diametr� eksperimento metu.
oju lapeliu buvo pikuojami � vegetacinius indu
urkiai.
III) 50 indiv./m (D_50 ir H
),..., )()2( kii x , yi – i-tojo individo d,( )1(
i xxko reikšm�, f(x) – bendru atveju netiesin� da
, �i – nepriklausomi ats. d., �i ~ N(0, �2). unkcija f(x) pa taip, kad atsprenkama
Pasirink
rus. Programai „Statistica“ pateikus mums regresin� kreiv� bei jos pa-etrus, kyla klausimas, ar gerai regresin� kreiv� atitinka eksperimento menis. Vienas svarbiausi� tinkamumo mat� vadinamasis determs koeficientas. Determinacijos koeficientas žym
krypio kvi 1. Kuo R2 ar�iau vieneto, tuo regresin� kreiv� geriau tinka ekspe-
rimentiniams duomenims. Pavyzdžiui, kai R2=0,7, galime teigti, kad 70% y variacijos paaiškinama nepriklausomu kintamuoju x.
Regresin� analiz� glaudžiai susijusi su koreliaciniais analiz�s meto-dais. Koreliacijos tarp kintam�j� stiprumo matas – koreliacijos koefi-cientas. Jis žymimas R ir apibr�žiamas kaip kvadratin� šaknis iš deter-minacijos koeficiento R2. Kuo yra R ar�iau 1 ar –1, tuo stipresnis kore-liacinis ryšys sieja nagrin�jamus kintamuosius.
Duomenys analizei Duotas duomen� failas „PomAugDinam.STA“, kuriame suvesti
duomenys apie po
Trumpas eksperimento aprašymas: Pomidorai su pirmu tikrus skirtingu tankumu. Pagal pasirinkto tankumo variant�, � vegetacin�
ind� buvo sodinama nuo 1 iki 60 daig�, – tai atitiko nuo 6 iki 340 vnt./m2 augimo tankumus. Eksperimento, kuris truko 67 paras (duomen� failo kintamasis – „trukme“), metu kas savait� buvo matuojamas pomidor� diametras (D) ir aukštis (H). Duomen� faile pateikti kiekvienos savait�s pomidor�, augusi� skirtingu tankumu, vid
Pomidor� tankumo variantai: I) 6 indiv./m2 (duomen� faile diametras D_6 ir aukštis H_6); II) 35 indiv./m2 (D_35 ir H_35);
2 _50);
61
IV) 85 in _85); V) 160 indiv./m2 (D_160 ir H_160); VI) 340 indiv./m2 (D_340 ir H_340).
div./m2 (D_85 ir H
Darbo eiga 1 užduotis Grafiškai pateikite pomidor� diametro ir aukš�io vidurkius ekspe-rimento metu, esant skirtingam j� augimo tankumui.
Programos „Statistica“ pagrindiniame meniu renkam�s komand� „Graphs“, toliau „Scatterplots...“
„2D Scatterplots“ lange pasirenkame „Advenced“ lap�, kuriame renkam�s grafiko tip� (Multiple) bei kintamuosius „Variables“.
Kintamuosius žymime taip: „X:“ – „TRUKME“, o „Y:“ – „D_6“, „D_35“, „D_50“, „D_85“, „D_160“, „D_340“.
Spaudžiame „OK“. Atsakymas pateikiamas rezultat� lange:
62
Kaip matome, eksperimento metu sukaupti duomenys apie diametro stor tine) Micherlicho augimo krei-ve,
� (1 – e –bT)c
uome-nims: a) 6 indiv./m2 tankumu augusi� pomidor� diametrui. Programoje „Statistica“ pasirenkame „Statistics“, „Advanced
Linear / Nonlinear Models“, „Nonlinear Estimation“. „Nonlinear Estimation“ analiz�s lange renkam�s „User-specified
regression, least squares“ ir „OK“. Naujai atsidariusiame lange renkam�s „Function to be estimat “. Micherlicho augimo kreiv� parašome taip:
� (D) gerai aproksimuot�si (eksponenkuri matematiškai aprašoma taip:
Y = �ia:
Y – morfometrinis augalo rodiklis; T – augalo amžius; e – nat�rinio logaritmo pagrindas; A, b, c – augimo funkcijos koeficientai.
2 užduotis Naudodami „Nonlinear Estimation“ analiz�s modul�, pritaikykite Micherlicho augimo tipo kreiv� pateiktiems eksperimento d
ed
V2=a*((–exp(–b*v1)+1)**c).
�ia: v2 (arba galima rašyti D_6) – 6 indiv./m2 diametro vidurki� kaita
eksperimento metu, tai „Y“ kintamasis; a, b ir c – A, b ir c augimo funkcijos koeficientai;
63
v1 (TRUKME) – eksperimento trukm� paromis, šiuo atveju „x“ kin-tamasis.
�raš� formul�, spaudžiame „OK“. Toliau analiz�s lange atsidarome „Advanced“ nurodyta toliau: lap� ir pasirenkame kaip
Pasirinkus „Start values“ komand�, reikia rašyti tokias koeficient�
skai�iavimo startines reikšmes:
Spaudžiame „OK“.
64
Skai�iavim� lange jau pateiktas modulio determinacijos koeficien-tas R2 ir koreliacijos koeficientas R. Pastarasis R=0,9899 rodo, kad yra stip )
eficiento reikšm� nurodo, kad apie 98 % eksperimento duomen� (6 indiv./m2 tankumu augusi� pomidor� diametrai) kito pagal Micherlicho augimo kreiv�, t. y. šio tipo kreiv� statistiškai patikimai išreiškia (aproksimuoja) pomidor� diametro kitim� per laik�.
Toliau pasirinkus komand� „Fitted 2D function & observed vals“, atsakym� lange pateikiamas aproksimuotos kreiv�s grafikas ir koefi-cient� reikšm�s (pažym�ta raudonai).
rus koreliacinis ryšys tarp pomidor� amžiaus (eksperimento trukm�ir diametro storio. O R2 šiuo atveju lygus 0,97986. Ko
b) Remdamiesi pateiktu aprašu, pritaikykite Micherlicho augimo tipo kreiv� likusi� tankum� (35, 50, 85, 160, 340 indiv./m2) pomidor� diametrams bei pasižym�kite sudaryt� kreivi� deter-minacijos koeficient� R2 reikšmes.
taikykite Micherlicho augimo tipo kreiv� vis� tankum� pomidor� aukš�iui.
Skai�iuojant aukš�io kitimo kreivi� koeficientus yra vienas skir-
tumas!!!!!! Pasirinkus „Start values“ komand�, reikia rašyti kitas koeficient�
skai�iavimo startines reikšmes:
c) Analogiškai pri
65
Visa kita darbo eiga nekinta.
3 užduotis Gautas funkcijas ir j� determinacijos koeficiento R2 reikšmes �kelki-te � pirmoje užduotyje gaut� grafik�. Pasirenkame pirma užduotimi gaut� grafik�. Spaudžiame dešin�j� pe-
l�s klaviš� ir pasirenkame komand� „Graph Properties (All Options)...“
Toliau „All Options“ lange renkam�s „Custom Function“ lap�, ku-riame spaudžiame „Add new function“. � funkcijos lang� �keliame D_6 tankumo diametro augimo lygt�, kuri� gavome atlik� 2 užduoties a) dal�. Spaudžiame „OK“.
66
Darb� kartokite, kol sukelsite visas funkcijas.
4 užduotis Atsakykite � šiuos klausimus: Kokie yra gaut� pomidor� diametro ir aukš�io augimo kreivi� de-
terminacijos koeficientai? Kiek eksperimento duomen� procent� atitinka Micherlicho augimo
krei
Klausimai savikontrolei: Kaip suprantate netiesin� ryš�? Koki� tip� gali b�ti netiesinio ryšio regresijos? Kas yra determinacijos koeficientas? Kokios gali b�ti jo reikšm�s?
v�s kitim�? Kaip kito pomidor� parametrai eksperimento metu, esant skirtin-
giems tankumams?
67
8 l a b o r a t o r i n i s d a r b a s Netiesin�s priklausomyb�s
analiz�s modeli� naudojimas 2 dal is
Darbo tikslas Naudodami netiesinio ryšio regresijos metodus, nustatykite s�jamo-sios pipirn�s (Lepidium sativum L.) tolerancijos temperat�rai inter-valus, esant skirtingai augimo terpei. Duomenys analizei
uomen� failas „pipirnes toleranc kreives.sta“, kuriame pateiktiuomenys apie s�jamosios pipirn�s vidutin� daigelio aukšt� milimet-
k tingoms augimo s�lygoms.
o-0
ul-
uvo tiriamas s�jamos pipirn�s tolerancijos tempera-t�rai pokytis veikiant skirtingoms teršian�ioms medžiagoms. Tiriant kom � teršian�i� medžiag� poveik� au-gim nama esant 12; 16; 20; 24; 28 ir 320C tem ir švino) koncentraci-jos M), esan indi gautas daigeli� aukš�io vidurkis, kuris duomen� faile pateikiamas nuo tre�io (Cu 0_01) iki šešto (Cu 0_3) stulpelio. Daigeli� aukš�io vidurkis, esant skirtingai temperat�rai ir 0,01; 0,05; 0,1; 0,3 ir 0,5 mM švino kon-centracijos poveikiui, pateiktas septintame – vienuoliktame stulpeliuose.
Darbo eiga 1 užduotis Grafiškai pateikite pipirn�s daigeli� aukš�io vidurk� esant skirtingai augimo temperat�rai.
D drais, esant s ir
Trumpas eksperimento aprašymas: Tyrimai su s�jam�ja pipirne buvo atlikti laboratorijoje, termostatu
se auginant s�jam�j� pipirn� esant 12; 16; 20; 24; 28 ir 32 C temperat�-rai (duomen� faile pateikiama stulpelyje „Temperatura“). O skirtingosetemperat�rose augusi� pipirn�s daigeli� aukštis pateiktas antrame stpelyje „H2O“.
Antrame etape b
pleksišk� temperat�ros ir skirtingui, s�jamoji pipirn� buvo augiperat�rai ir �vairi� teršian�i� medžiag� (vario tirpale. Skirtingos vario koncentracijos (0,01; 0,05; 0,1 ir 0,3 mt tam tikrai temperat�rai, poveik� pipirn�s daigeli� aukš�iui atsp
68
Pagrindiniame “, kurioje ieš-kome komandos „ tamuosius „Va-riables“:
„X“ ašyje pasirenkame pirm „Temperatura“, o „Y“ – antr� stulpel� „H2O“, kuriame pateiktas dai i� aukš�io vidurkis, pipirn� au-ginant vien distiliuotame vandenyje.
„lin
meniu pasirenkame komand� „GraphsScatterplots...“. Toliau renkam�s kin
� stulpel�gel
„Advenced“ lape pasirenkame grafiko tip� „Regular“ ir išjungiame ear fit“, t. y. pasirenkame „Off“. Spaudžiame „OK“.
Grafikas pateikiamas atsakym� lange:
Jeigu sujungtume vidurki� taškus, pasteb�tume, jog pipirn�s dai-geli� aukš�io kitimas, esant skirtingai temperat�rai, panašus � pipir-n�s tolerancijos temperat�rai kreiv�, kuri dar vadinama Šelfordo to-lerancijos kreive. Tad ši� kreiv� ir bandysime pritaikyti gautiems duomenims.
2 užduotis
Naudodami netiesin�s priklausomyb�s analiz�s modul�, nubraižyki-te pipirn�s daigelio aukš�io kitimo kreiv� kintant temperat�rai, kai
istiliuoto vandens terp�je. pipirn�s reakcij� � temperat�r� išreiškiame (aproksi-
muo
–a+b*t–c*t2)
pipirn� augo dS�jamosios sime) eksponentine Šelfordo tolerancijos kreive:
Daigelio aukštis =exp(
69
Pagrindiniame meniu pasirenkame komand� „Statistics“, toliau „Advanced Linear / Nonlinear Models“ ir „Nonlinear Estimation“:
„Nonlinear Estimation“ analiz�s lange renkam�s „User-specified regr
=exp((–a)+(b)*v1– (c)*(v1*v1)),
kš�io vidurkis esan asis;
jos koeficientai; v1 (Temperatura) – pipirin�s augimo temperat�ra, šiuo atveju „x“
kintamasis. �raš� formul�, spaudžiame „OK“. Toliau analiz�s lange atsidarome
„Advanced“ lap� ir pasirenkame kaip nurodyta toliau:
ession, least squares“ ir „OK“.
Naujame lange renkam�s „Function to be estimated“ ir atsidariusia-me lange rašome reikiam� funkcij�: v2
�ia: v2 (arba galima rašyti H2O) – pipirn�s daigeli� aut skirtingai temperat�rai, tai „Y“ kintama, b ir c – a, b ir c eksponentin�s funkci
Paspaud� mygtuk� „Start values:“, užduodame programai, nuo ku-
ri� reikšmi� prad�ti skai�iavim�.
Spaudžiame „OK“.
70
Pasirinkus komand� „Fitted 2D function & observed vals“, atsa-
kym� lange pateikiamas aproksimuotos kreiv�s grafikas ir koeficient� reikšm�s (pažym�ta raudonai viršuje). Sutvarkome grafiko aši� pavadi-nimus ir pakei�iame „x“ ašies skal� nuo 0 iki 40.
3 užduotis
Pakomentuokite determinacijos koeficiento reikšm�. Koki� temperat�r� pipirn� gali toleruoti? Kokia optimali ir pesimali pipirn�s augimo temperat ra? �
71
4 užduotis
Naudodami netiesin�s priklausomyb�s analiz�s modul�, nubraižyki-te pipirn�s daigelio aukš�io kitimo kreives, kintant temperat�rai, šiose augimo terp�se:
a) b) 0,01 mM vario terp�je, b) 0,05 mM vario terp�je, c) 0,1 mM vario terp�je, d) 0,3 mM vario terp�je, e) 0,01 mM švino terp�je, f) 0,05 mM švino terp�je, g) 0,1 mM švino terp�je, h) 0,3 mM švino terp�je, i) 0,5 mM švino terp�je.
5 užduotis
Pakomentuokite determinacijos koeficient� reikšmes, esant skirtin-goms augimo terp�ms.
Kaip kei�iasi pipirn�s tolerancija temperat�rai, esant skirtingoms augimo terp�ms?
Klausimai savikontrolei: Kas yra netiesin� regresija? Kas atspindi regresinio modelio „gerum�“?
Sukelkite gautas kreives � vien� paveiksl�, kaip tai buvo padaryta 7
laboratorinio darbo 3 užduotyje.
72
9 l a b o r a t o r i n i s d a r b a s
Darbo�vertinki d�sningumus. Teorija Laiko eilu t� vienodais laiko ar
erdv�s tarp žiami du pagrindiniai uždaviniai: 1 � prigimtis, t. y. išski-riami pagr uomenims (metodai – duomen� glo ninim imas bei autokoreliaci-ja);
asis uždavinys. plinkos tyrim� laiko eilu�i� pavyzdžiai: radialiojo prieaugio se-
kos eaugio indeks� sekos; kas valand� matuota temperat�-ra, dr -
iko eilut�se zt, t = 1, 2, …, n stebimos šios de-dam
s – bendra eilut�s kitimo tendencija, žymimas ft; � sezoniškumo dedamoji st, s�lygota Žem�s sukimosi apie
vo aš� (metiniai ir paros ciklai); ai apie trend�, žymimi ut;
mi atsitiktiniai dydžiai �t,
Konkreti laiko eilut� susideda iš 4 min�t� dedam�j� (neb�tinai iš vis�). Pavyzdžiui, radialiojo prieaugio sekose aiškiai matomas augimo trendas. Prieaugio sekos modelis multiplikatyvinis – jauno medžio radialusis prieaugis didesnis, tod�l klimato rodikli� poky�iai sukelia didesnius jaun� augal� nei brandži� augal� prieaugio svyravimus. Tiriant Saul�s aktyvum�, stebimi cikliški 11 met� svyravimai su kintamomis amplitud�mis. Kintant valandos temperat�rai, stebima sezoniškumo dedamoji, s�lygota paros svyravim�; šios laiko eilut�s modelis adityvinis. Prieaugio indeks�, m�nesio vidutini� temperat�r�
Laiko sekos 1 dal is
tikslas te medži� radialinio prieaugio sekos
t� – kintamojo reikšmi�, nustatyais, seka. Analizuojant eilutes, sprend
) nustatoma nagrin�jam� duomenkindiniai vei sniai, turintys �tak� d
t as, tinkamos kreiv�s parink ir 2) prognozuojami ateities rezultatai (slenkam�j� vidurki�, eks-
ponentinio glotninimo bei autoregresijos metodai). Šio laboratorinio darbo metu bus sprendžiamas pirm
A; radialiojo pri
�gm�, v�jo greitis; metini� Saul�s aktyvumo rodikli� seka; atmosferos teršal� (ozono, dulki�) kiekio sekos ir t. t.
Min�tose aplinkos laosios:
� trenda
Saul� arba apie sa� reguliar�s svyravim� atsitiktin� dedamoji – nepriklauso
t = 1, 2, …, n.
73
laiko eilutes galima s apie vidutin� reikšm�.
Trendo vertinimas. Tre rtinamas parametriniu ir nep etriniu metodu. Parametrinis metodas: trendas nusakomas tam tikr avidalo funkcija, turin�ia nežinomus parametrus. Šie parametrai vert kvadrat� metodu: f(t) parenkama taip, kad b�t� kuo ar�i a n�ra monotoniškas – sunku rasti tinkam� parametrin� funkcij�. D�l šios prie naudojami neparametriniai trendo �ver�iai. Vienas nep
atavimai atlikti Jonavos rajono miškuose, d o faile jie išk�
Nu yb�, pvz., e pateikti kli-
vienais S ir t. t. – vidutinis krituli� kiekis; TPBIR, TPL
laikyti reguliariaisiais svyravimai
nda t) ves ft = f(aramo pinami mažiausi�au zt reikšmi�. Laiko eilut�s bendras kitimas sud�tingas arb
žasties arametrini� trendo �ver�i� – (2m + 1) slenkan�ioji. Pavyzdžiui,
radialiojo prieaugio trendas (augimo trendas) vertinamas 11 met� slenkan�iaja.
�vertinus trend�, sudaroma laiko eilut� be trendo �takos. Pagal dedam�j� kombinacijas laiko eilut�je sudaroma laiko eilut� be trendo �takos. Radialiojo prieaugio eilut�s modelis: zt = f(t)ut. Radialiojo prieaugio eilut� be trendo �takos vadinama radialiojo prieaugio indeks� eilute: I(t) = zt×100/f(t). Radialiojo prieaugio indeksas parodo, koki� dal� (procentais) sudaro prieaugio reikšm�, palyginti su trendo reikšme. I(t) sekoje atmesta amžiaus ir augimo s�lyg� �taka; I(t) vidurkis artimas 100.
Duomenys analizei Duotas duomen� failas su skirting� mišk� medži� prieaugio sek�
duomenimis (failas Laiko sekos.sta) nuo 1921 m. iki 2001 m. Radikaliojo prieaugio m u men�pateikti nuo 13 iki 20 kintamojo, kuri� pavadinimai – sutrumpinti mpavadinimai. Pirmuose dviejuose failo stulpeliuose pateikta met� seka.
o 3 ir iki 12 kintamojo suvesti duomenys apie aplinkos kokCO, NO, SO2 tarš� 1981–2001 m. Toliau 21–58 stulpeliuosmato rodikliai: TSAU, TVAS ir t. t. – m�nesio vidutin� temperat�ra kiek-
metais; KSAU, KVAIE ir t. t. – vidutin� pra�jusi� met� m�nesio temperat�ra; KPBIR,
KPLIE ir t. t. – vidutinis pra�jusi� met� m�nesio krituli� kiekis. Darbo eiga 1 užduotis Pateikite pasirinkt� prieaugi� sekos dinamikos grafik�.
Programoje „Statistica“ pasirenkame „Statistics“, „Advanced Linear/
Nonlinear Models“, „Time Series/Forecasting“:
74
Pirmiausia renkam�s kintamuosius „Variables“ nuo 13 iki 15 stul-pelio. Spaudžiame „OK“.
Toliau renkam�s mygtuk� „OK (transformations, autocorrelations, crosscorrelations, plots)“:
Naujai atsidariusiame lange pasirenkame „Review & plot” lap�, ja-
me – „Plot“ mygtuk�. Toliau pele pažymime visus pasirinkt� 13–14 kintam�j� pavadini-
mus ir spaudžiame „OK“. Mums reikiamas grafikas pateikiamas atsakym� lange:
Iš pateikt� medži� prieaugio kreivi� matome bendr� d�sningum�:
jauni medžiai kasmet priauga daugiau nei subrend� ir b�gant metams
75
prie ti iv�.
�vertinkite nurodytos sekos trend� pavidalo a*exp(–c*t)+b. Koefi-cientus a, b ir c raskite mažiausi� kvadrat� metodu. Trendui vertinti naudokite netiesini� �ver�i� „Nonlinear Estimation“ modulio „User-specified regression“ sekcija.
Pagrindiniame meniu pasirenkame „Statistics“, „Advanced Linear/ Nonlinear Models“, „Nonlinear Estimation“.
„Nonlinear Estimation“ analiz�s lange renkam�s „User-specified regression, least squares“ ir spaudžiame „OK“.
Naujai atsidariusiame lange renkam�s „Function to be estimated“, regresijos lygt� rašome taip: v14= a*exp(-c*(METAI-1933))+b.
„V14“ yra kintamojo stulpelio numeris, arba galima rašyti prieaugio sekos pavadinim� „AZ10017“.
augio dydis vis maž�ja. Norinti �vertinti trend�, galima pam�ginpritaikyti eksponentin� kre
2 užduotis
„t“ yra laikas, tod�l šiuo atveju rašome „METAI-1933“, nes pirmi prieaugiai min�tame miške fiksuoti 1933 m.
Suved� formul�, spaudžiame „OK“. Ir dar kart� „OK“.
Skai�iavim� lange pateikiamas eksponentinio modelio determinaci-
jos koeficientas R2=0,918, kuris nurodo, jog m�s� pasirinktas modelis gana gerai (92 % duomen�) atitinka prieaugio d�sningum�.
Pasirinkus komand� „Fitted 2D function & observed vals“, atsakym
-� lange pateikiamas trendo grafikas ir eksponentin�s lygties koefi-
cient� reikšm�s (pažym�ta raudonai).
76
Gr�žus � skai�iavim� lang� ir pasirinkus „Predicted values, Residuals, etc.“, atsakym� lange pateikiamos konkre�ios reikšm�s, paskai�iuo-tos pagal min�t�j� eksponentin� lygt�. „Observed“ – išmatuoti prie-augiai; „Predicted“ – paskai�iuoti pagal eksponentin� lygt� prieau-giai; „Residuals“ – liku�iai, t. y. skirtumas tarp išmatuot� ir paskai-�iuot� reikšmi�.
Toliau kopijuojame „Predicted“ stulpel�, kur� tur�sime perkelti � duomen� fail�: tam pažymime vis� stulpel�, spaudžiame dešin�j� pel�s klaviš� ir renkam�s komand� „Copy“.
Pagal eksponentin� lygt� paskai�iuotus prieaugius (nukopijuot� „Predicted“ stulpel�) keliame � duomen� fail� (prieš tai jame pridedame nauj� stulpel�). Renkam�s „Vars “, toliau „Add...“
Ir perkeliame kopijuot� stulpel� iš rezultat� lango � duomen� fail�:
77
3 užduotis Pateikite prieaugio sekos bei eksponentinio trendo grafik�. Kaip ir pirmoje užduotyje pasirenkame „Statistics“ „Advanced
Linear / Nonlinear Models“ „Time Series / Forecasting“. Toliau renkam�s kintamuosius „Variables“ v14 (AZ10017), ir v15
(exp trendas) stulpelius. Spaudžiame „OK“ ir „OK (transformations, autocorrelations,
crosscorrelations, plots)“. Naujai atsidariusiame lange pasirenkame „Review & plot lap�, jame – „Plot“ mygtuk�, kaip ir pirmoje užduotyje.
Grafikas pateikiamas atsakym� lange:
4 užduotis a) Apskai�iuokite prieaugio sekos indeksus, t. y. procentais �ver-
tinkite skirtum� tarp išmatuot� reikšmi� ir paskai�iuot� pagal trendo lygt�. Naudojame formul�:
I(t)=z(t)*100/f(t);
�ia, z(t) – išmatuotos prieaugio reikšm�s, f(t) – eksponentinio trendo reikšm�s. � duomen� fail� �terpiame dar vien� nauj� stulpel� ir pavadiname
„exp tr indeksai“.
78
Mums reikiam� lygt� �rašome „Long name (label or formula with Functions)“ lange.
Formul� rašome taip:
=v14*100/v15, �ia: v14 – lygties z(t) narys, šiuo atveju išmatuoti prieaugiai
(„AZ10017“ stulpelis), v15 – lygties f(t) narys, šiuo atveju paskai�iuoti pagal eksponentin�
lygt augiai („exp trendas“ stulpelis). � prie
Naujai atsiradusiame lange spaudžiame „Yes“.
askai�iuotos indeks� reikšm�s atsiranda naujame duomen� failo stul
Ppelyje:
b) Pateikite prieaugio indeks�, apskai�iuot� naudojant eksponenti-nio trendo �ver�ius, grafik�.
79
Kaip ir ankstesn�se užduotyse pasirenkame „Statistics“ „Advanced Linear/Nonlinear Models“, „Time Series/Forecasting“. Toliau renka-m�s kintam�j� „Variables“ v16 (exp tr indeksai) stulpel�. Spaudžiame „OK ations, autocorrelations, crosscorrelations, plots)“. Naujai atsid renkame „Review & plot“ lap�, jame Plot“ mygtu sn�se užduotyse.
“ ir „OK (transformariusiame lange pasik�, kaip ir ankste – „
Grafikas pateikiamas atsakym� lange:
Pateiktame grafike matome radialiojo prieaugio eilut� be trendo
�takos, kuri vadinama radialiojo prieaugio indeks� eilute. Radialiojo prieaugio indeksas parodo, koki� dal� (procentais) sudaro priea gio reik ) (indeks�) vidurkis artim
Tod�l b�tina š� darbin� fail� išsaugoti kom-piuterio atmintyje ar kitoje nešiojamoje informacijos laikmenoje!
Klausimai savikontrolei: Kas yra laiko seka? Kokios dedamosios b�dingos aplinkos laiko eilut�ms? Kas yra indeks� eilut�?
ušm�, palyginti su trendo reikšme. Matome I(t
as 100.
Tolesn� medži� radialinio prieaugio sekos analiz� bus atliekama 10 laboratoriniame darbe.
80
1 0 l a b o r a t o r i n i s d a r b a s Laiko sekos
2 dal is Darbo tikslas �vertinkite medži� radialinio prieaugiorin�kite prieaugio indeks� eilutes.
sekos d�sningumus. Panag-
Duomenys analizei 9 laboratorinio darbo duomen� failas su skirting� mišk� medži�
prieaugio sek� duomenimis bei jau paskai�iuotu eksponentiniu trendu ir radialiojo prieaugio indeksais (failas Laiko sekos-2.sta).
1 užduotis �vertinkite medži� prieaugio trend� remdamiesi 11 met� slenkan�i�-
ja. Naudokite „EXCEL“ program�.
Pasirinkto miško, šiuo atveju AZ10017 (v14), prieaugio sekos reikšmes kopijuokite � EXCEL fail�.
oliau skai�iuosime 11 met� vidurkius: T
�raš� vidurkio skai�iavimo formul� spaudžiame „Enter“, nutem-
piame formul� žemyn iki galo ir paliekame 5 apatinius prieaugius laisvus.
81
Nauj� stulpel�, t eikšmes, kopi-juojame ir keliame prie an � „Statistica“ programos
. y. paskai�iuotas 11 met� vidurki� rkstesni� stulpeli�
duomen� fal�, tik prieš tai p pel� („11metu sl trend“), anal giškai kaip buvo parodyta auk
ride j� stuldame nauš�iau.o
2 užduotis Apskai�iuokite prieaugio sekos indeksus �vertin� trend� 11 met�
slenkan�i�ja.
Duomen� faile pridedame dar vien� nauj� stulpel� „11met sln indeks“.
Indeksai skai�iuojami analogiškai kaip parodyta 9 laboratorinio darbo 4 užduotyje, tik formul� rašome taip:
=v14*100/v17. Visk� atlikus, 11 met� slenkan�iosios prieaugio sekos indeksai pa-
teikiami naujame duomen� failo stulpelyje.
3 užduotis a) Pateikite prieaugio sekos bei abiej� trend� grafik�.
“, „ “.
Kaip ir ankstesnese užduotyse pasirenkame „Statistics“, „Advanced
Linear / Nonlinear Models Time Series / Forecasting
82
Toliau renkam�s kintamuosius „Variables“: v14 (AZ10017), v15 (exp trendas) ir v17 (11metu sl trend) stulpelius.
Spaudžiame „OK“ ir „OK (transformations, autocorrelations, cros-scorrelations, plots)“.
Grafikas pateikiamas atsakym� lange:
b) Pateikite prieaugio indeks�, apskai�iuot� naudojant abu trendo �ver�ius, grafik�. Visk� atliekame analogiškai kaip nurodyta, tik šiuo atveju renkam�s
v16 (exp tr indeksai) ir v18 (11metu sln indeks): Grafikas pateikiamas atsakym� lange:
Pateiktame grafike matome radialiojo prieaugio eilut� e trendo
�tak nama radialiojo prieaugio indeks� eilute. Radialiojo o prieaugio
reikšm�, palyginti su trendo reikšme. I(t) (eksponentinio trendo ir 11 met
0.
bos, kuri vadi
prieaugio indeksas parodo, koki� dal� (procentais) sudar
� slenkan�iosios trendo indeks�) sekoje atmesta amžiaus ir augimo s�lyg� �taka. Kaip matome, I(t) (indeks�) vidurkis artimas 10
83
4 užduotis Paskai�iuokite prieaugio indeks�, apskai�iuot� naudojant abu tren-
do �
tistics“, „Basic Statsitics and K“.
Kintamuosius „Variables“ renkam�s taip: „First variable list:“ lange – nuo 25 iki 62 kintamojo, „Second variable list (optional):“ – 16 ir 18, t. y. „exp tr indeksai“ ir „11met sln indeks“.
Spaudžiame „OK“. Naujai atsiradusiame lange renkam�s „Options“ la-p� ir pažymime „Display r, p-levels, and N‘s“. Spaudžiame „Summary“.
Atsakymas pateikiamas atsakym� lange:
ver�ius, koreliacijas su klimato rodikliais. Nurodykite patikimas ko-reliacijas.
Pagrindiniame meniu pasirenkame „Sta Tables“, „Correlation matricos“ ir „O
Matomi koreliacin�s analiz�s rezultatai rodo, jog eksponentinio
trendo indeksai statistiškai patikimai koreliuoja su vasario ir kovo m�ne-si� temperat�ra, o 11 met� slenkan�iosios indeksai su sausio, vasario ir kovo m�nesi� temperat�ra. Perži�rime vis� koreliacijos koeficient� reikšmes bei j� patikimum� ir išrenkame, su kokiais dar klimato rodik-liais indeksai koreliuoja statistiškai patikimai.
5 užduotis Pateikite medži� radikaliojo prieaugio (tiek eksponentinio, tiek ir
slenkan�io vidurkio trend�) indeks� autokoreliacines funkcijas. Kaip ir ankstesn�se užduotyse renkam�s „Statistics“ „Advanced Li-
near / Nonlinear Models“ „Time Series /Forecasting“. Toliau renkam�s kintamuosius „Variables“ v16 (exp tr indeksai) ir v18 (11metu sln indeks).
Spaudžiame „OK“ ir „OK (transformations, autocorrelations, crosscorrelations, plots)“, naujai atsiradusiame lange renkam�s „Autocorrs“ lap�, jame – „Autocorrelations“ mygtuk�.
84
Atsakymas pateikiamas atsakym� lange:
Norint paskai�iuoti 11 met� slenkan�iosios trendo indeks� autoko-
relia ir pasirinkti kit� kintam�-j�, o visa ki
cin� funkcij�, reikia gr�žti komand� lang�ta kartoti taip pat.
Atsakymas pateikiamas naujame lange:
Kaip matome, abiej� trend� indeks� autokoreliacin�s funkcijos pa-
našios � g�stan�ias sinusoides. Taigi galima tvirtinti, jog laiko eilut�je yra cikliniai svyravimai. Klausimai savikontrolei: Kas yra laiko seka? Kokios dedamosios b�dingos aplinkos laiko eilut�ms? Kas yra indeks� eilut�?
85
1 1 – 1 4 l a b o r a t o r i n i a i d a r b a i Kartojimo uždaviniai
1 užduotis Paskai�iuokite, koks buvo pipirn�s daigeli� aukš�io vidurkis, vidur-kio standartin�s paklaidos bei vidurkio 99 % tikimyb�s pasikliauti-nai intervalai, esant skirtingoms augimo s�lygomis, t. y. 25 ir 15 0C temperat�rai, 0,1 mM švino (koduota – Pb 0,1) poveikiui be terp�s
temperat�ra � Daigelio aukštis Šaknel�s ilgis
i r�gštumui pH 4,5? Kontrolinis variantas pažym�tas – K.
Augimo Augimo terp
25 K 60 5025 K 65 5625 K 65 5225 K 55 6025 K 50 5925 K 65 5625 K 50 4025 K 60 4525 K 65 5925 K 65 5025 Pb 0.1 30 2525 Pb 0.1 30 2525 Pb 0.1 25 1025 Pb 0.1 25 1925 Pb 0.1 25 1325 Pb 0.1 25 2025 Pb 0.1 30 2525 Pb 0.1 30 1225 Pb 0.1 40 1925 Pb 0.1 40 2025 pH 4.5 45 3025 pH 4.5 45 3025 pH 4.5 35 29
86
25 pH 4.5 40 2825 pH 4.5 40 2625 pH 4.5 45 3025 pH 4.5 30 1925 pH 4.5 35 2025 pH 4.5 30 2225 pH 4.5 30 2015 K 25 5215 K 25 4015 K 20 3515 K 20 3015 K 25 3815 K 25 3515 K 25 3415 K 25 3315 K 25 3515 K 20 2015 P 1b 0. 20 1515 P 1b 0. 20 1315 P 1b 0. 15 1515 P 1b 0. 25 2015 P 1b 0. 25 1915 P 1b 0. 25 1815 P 1b 0. 15 1315 Pb 0.1 15 1515 Pb 0.1 15 1115 Pb 0.1 20 1515 pH 4.5 25 4015 pH 4.5 30 5515 pH 4.5 30 5015 pH 4.5 35 5515 pH 4.5 20 5015 pH 4.5 25 5515 pH 4.5 30 5515 pH 4.5 35 5015 pH 4.5 25 5215 pH 4.5 20 53
87
2 uždGrafiškai pateikite pip aigeli� vidurk irtingomis aug o s�-lygomRemd esi gautais s � rezultata grafikais, atsakykite � šiuo usimus: � K os augimo s� vo palankia s pipirnei augt� K omis augimo mis pipirn�s aukštis buvo mažiausias? � �vertinkite statisti šmingus skirtumus.
3 uždPaska okite, koks vi nis pipirn�s daigeli� aukštis, esan 5 0C augim mperat�rai, ne kyr� terp�s pov
4 uždNaud i „t kriterij�“ atikrinkite, ar st tiškai patikima yr�-si pipi s daigeli� aukš vidurkis, esant ntrolinei augim rpei ir r�gš m augimo substratui, 15 0C? Taip p atikrinkite ir k tyrimo variant� durki� skirtum 5 užd�verti temper imo terp tatistiškai reikpavei pipirn�s dai aukš�io kitim tsakym� pa skite naudo i dispersin� z�s metodus). 6 užd�verti kirtingos mperat�ros ir ngos augim rp�s povei ipirn�s daige kš�iui ir šakne ilgiui. Kas lab vei-k� pip s augim�: te t�ra ar augimo p�? 7 užd�verti mpleksi perat�ros i irtingos augim rp�s povei ipirn�s daige �iui ir šakne ilgiui. 8 uždPaska okite koreli koeficient� ir jo patikimumo l pipirn aigeli� aukš akneli� ilgio bei pateikite ties�s lygt�:
a) � bandym t�; b) kontrol�s, s bendrai abi perat�ras; c) esant švin ikiui, pa�mus drai abi tempe ras;
uotis irn�s d � sk im
is. ami kai�iavim is bei s klaoki lygos bu usio i? oki s�lygo
kai reik
uotis i�iu duti t 2o te išs eikio.
uotis odam , p atis i skrn� �i� ko o te�iaat p it� vi us.
uotis nkite, ar at�ra ir aug � s šmingai k� dam
geli� s anali
�? (A gr�
uotis nkite s oro te skirti o tek� p lio au l�s iauirn� mpera ter
uotis nkite ko n� oro tem r sk o tek� p lio aukš l�s
uotis i�iu acijos yg� tarp�s d �io ir š
vis o variantik pa�mu temtik o pove ben rat�
88
d) tik esant augimo terp�s r�gštumui pH 4,5 taip pat pa�mus
i duomenys apie pomidor� sausosios mas�s ki-iame
tvirtame ir penk-
tam ulpeliuose – esant skirtingam substrato pH bei dar papil-mio poveikiui. Taigi su programa „Statistica“ sukurki-
Laikas, p pH 6 pH 8 pH 6+Cd pH 8+Cd
bendrai abi temperat�ras. 9 užduotis Lentel�je pateikiamtim� eksperimento metu nuo 23 iki 57 paros. Antrame ir tre�stulpeliuose pateiktos vidutin�s pomidor� sausosios mas�s, esantatitinkamai augimo substrato pH reakcijai, o ke
e stdomam kadte duomen� fail�.
aros 23 0,17693 0,103716 0,144082 0,094828 29 0,35283 0,24532 0,245256 0,19722 36 0,54076 0,597983 0,467499 0,467224 43 0,88906 0,954015 0,588657 0,790535 50 1,17397 0,977761 0,91661 0,829264 57 1,26664 1,05001 0,986001 0,905001 0 užduotis 1
Grafiškai pateikite pomidor� sausosios mas�s kitim� eksperimento
l�, pritaikykite (–b*x)+1)**c) kreiv� pateiktiems eksperimento duome-
šiuos klausimus:
o
metu, esant skirtingiems augimo substratams. 11 užduotis
audodami „Nonlinear Estimation“ analiz�s moduNY=a*((–expnims.
2 užduotis 1Atsakykite �Kokie gaut� pomidor� saus� masi� augimo kreivi� determinacijos koeficientai? Kie r omen� atitinka pateikt� augimk p ocent� eksperimento dukreiv�s kitim�? Kaip kito pomidor� sausoji mas� eksperimento metu, esant skirtin-goms augimo s�lygoms?
89
13 užduotis Lentel�je pateikiamas vieno miško vidutinis medži� prieaugis per
isdešimt met�. Programoje „Statistica“ sukurkite duomen� fail�.
Me
tr
tai 1 2 3 4 5 6 7 8 9 10 Prieaugis 2,99 3,4 3,48 3,96 3,65 3,21 3,67 3 2,66 2,23 Metai 11 12 13 14 15 16 17 18 19 20 Prieaugis 2,37 1,82 2,38 1,8 2,55 16 17 18 19 20 M 22 23 24 25 26 27 28 29 30 etai 21Prieaugis 1,2 1,08 1,63 1,89 1 1,531,48 ,66 1,38 1,51 1,71
14 užduPat
otis eikite pri kos di grafik
užduotisrtinkite n seko avida (–c*t)+ -tus a, b te maž adrat� Trend i okite netiesi �ver�i� ear Es moduli
ression“ sekcij�.
eaugio se namikos �. 15 �ve urodytos s trend� p lo a*exp b. Koeficien
audir c raski
ni�iausi� kv „Nonlin
metodu.timation“
ui vertinto „User-n
specified reg 16 užduotis Pateikite prieaugio sekos bei paskai�iuoto eksponentinio trendo gra-fik�. 17 užduotis a) Apskai�iuokite prieaugio sekos indeksus, t. y. procentais �ver-
tinkite skirtum� tarp išmatuot� reikšmi� ir paskai�iuot� pagal gt�. Naudojame formul�:
tuotos prieaugio reikšm�s,
trendo lyI(t)=z(t)*100/f(t);
�ia: z(t) – išmaf(t) – eksponentinio trendo reikšm�s.
b) Pateikite prieaugio sekos indeks� grafik�.
90
Literat�ra
1. �ekanavi�ius V., Murauskas G. Statistika ir jos taikymai. I dalis. V.: TEV. 0. 2 p.
u s a i a i T2002. 272 p.
biliu Tikimybi rij m at ta . ius ok
Loader C. Local regression and Likelihood ew rk: S ringer 1999., W nvi en Sta s s. P
16. iegorsch Walter W. Analyzing Environmental Data. John Wiley and Sons.
7.8. Statistika su Statistica. Vilnius: Margi raštai. 1998. 227 p. 9.
10.trantams ir doktorantams. Kaunas. 2000.
11.
200 38 2. �ekanavi�ius V., M rauska G. St tistika r jos t ikyma . II dalis. V.: EV.
3. Ku s J. � teo a ir atem in� s tistika Viln : M slas.1996.
4. . N Yo p , 5. Ott ayne R. E ronm tal tistic and Data Analysi CRC ress
Inc., 1994. 3 3 p. P2005. 496 p. Sakalauskas V. Duomen� analiz� su STATISTICA. Vilnius. 2003. 235 p. Sakalauskas V.Townend J. Practical statistics for environmental and biological scientists. John Wiley and Sons. 2002. 286 p. Venclovien� J. Program� paketo „Statistika“ taikymas aplinkos duomen� analizei. Mokymo priemon� magis60 p. Venclovien� J. Statistiniai metodai aplinkotyroje. Kaunas. 2008. 236 p.
91
92
Januškaitienė, Irena Ja46 Aplinkos duomenų analizės ir modeliavimo laboratoriniai darbai, me-
todinė priemonė / Irena Januškaitienė. – Kaunas: Vytauto Didžiojo universitetas, 2009. – 92 p. ISBN 978-9955-12-494-8 UDK 311:004.9:504(076)
Irena Januškaitienė APLINKOS DUOMENŲ ANALIZĖS IR MODELIAVIMO
LABORATORINIAI DARBAI Metodinė priemonė
Redaktorė Renata Endzelytė Maketuotoja Janina Baranavičienė
2009-06-17. Tiražas 50 egz. Užsakymo Nr. 83
Išleido ir spausdino Vytauto Didžiojo universitetas, S. Daukanto g. 27, LT-44249 Kaunas