Upload
pipek-pipekej
View
103
Download
0
Embed Size (px)
Citation preview
1| Strona
Statystyka laboratorium 4
1.
Tworzenie bazy w programie STATISTICATworzenie bazy danych za pomoc importu z arkusza kalkulacyjnego Excel. Zadanie 1. Kodowanie zmiennych w arkuszu Excel.
Otwrz Zbir w Excelu Dane laboratorium 4 statystyka. Zakoduj w nowych kolumnach wszystkie zmienne tekstowe wedug formuy: Pe: nowa kolumna kod_pe , sposb zakodowania: kobieta 1; mczyzna 0; Wyksztacenie: nowa kolumna kodwyksz , sposb zakodowania: rednie - 1 , maturalne 2, wysze 3, wysze magisterskie 4; Miejscowo zamieszkiwana: nowa kolumna kod_miejscowo , sposb zakodowania: wie - 1, gmina 2, miasto 3; Czy pali papierosy: nowa kolumna kod_palenie , sposb zakodowania: tak- 1, nie 0.
Zamknij zbir. Zadanie 2. Utworzenie zbioru w programie STATISTICA Uruchom program STATISTICA i okienku Witamy w STATISTICA zaznacz Otwrz arkusz EXCELA.
2| Strona
Statystyka laboratorium 4
Zaznacz zbir, ktry ma by przeniesiony( tu przenoszony jest z pulpitu)
Wpisz nazw zbioru i otwrz go.
Wybierz arkusz
3| Strona
Statystyka laboratorium 4
Jeli widzisz
To dobrze wykonano polecenie. 2. Wejd w zakadk Dane Specyfikacja zmiennej
4| Strona
Statystyka laboratorium 4
Zaznacz Wszystkie specyfikacje.
5| Strona
Statystyka laboratorium 4
Zaznacz Typ zmiennej, typ skali, w etykietach wpisz nazwy, ktre maj pojawia si w tabelach i na wykresach. Po zdefiniowaniu wszystkich zmiennych
OK
6| Strona
Statystyka laboratorium 4
3. Zapisywanie bazy. a. Wybierz Plik nastpnie Zapisz jako i wpisz nazw pliku Nazwisko_laboratorium4.
Analiza pojedynczej zmiennejPrzypomnienie ( a moe co nowego?) Oznaczmy obserwowane wartoci zmiennej X przez x1, x2, , xn. Miary pooenia Dla zmiennych wyraonych w skali interwaowej i ilorazowej klasycznymi miarami tendencji centralnej to najczciej rednie, ktre informuj o przecitnym poziomie cechy, nie odzwierciedlajc rnic pomidzy poszczeglnymi jednostkami. W zalenoci od postaci wartoci zmiennej stosujemy: -redni arytmetyczn (gdy wartoci zmiennej mona dodawa), -redni geometryczn (gdy wartoci zmiennej mona mnoy), -redni harmoniczn (gdy wartoci zmiennej mona dodawa). Warto redniej wyznaczamy jeli wartoci zmiennej s jednorodne. rednia arytmetyczna rednia arytmetyczna rwna si sumie wszystkich wartoci zmiennej podzielonej przez ich liczb. Dla zmiennej, ktra przyjmuje wartoci x1, x2, , xn rednia arytmetyczna x wynosi:
x=
1 n xi , n i =1
5% rednia ucita - rednia wyznaczona z wartoci zmiennej , z ktrych wyeliminowano 5% najwikszych i 5% najmniejszych wartoci. Warto 5% redniej ucitej wyznacza si gdy chcemy aby zmienne nietypowe nie zakcay wartoci redniej. rednia geometryczna rednia geometryczna xg jest pierwiastkiem n - tego stopnia iloczynu n wartoci zmiennej. Stosuje si j gwnie przy badaniu zmian tempa zjawisk . rednia geometryczna w mniejszym stopniu ni rednia arytmetyczna odzwierciedla wpyw wartoci ekstremalnych na przecitny poziom zmiennej. rednia geometryczn wyznacza si ze wzoru:
x g = n x1 x2 ...xn .Z definicji wynika, e redni geometryczn moemy wyznacza tylko wtedy, gdy wartoci obserwacje s liczbami dodatnimi i rnymi od zera. rednia harmoniczna redni harmoniczna xh (dla liczb rnych od zera) nazywamy odwrotno redniej arytmetycznej z odwrotnoci wartoci zmiennej. Oblicza si j, gdy wartoci zmiennej s podane w jednostkach wzgldnych. rednia harmoniczn wyznacza si ze wzoru:
x =(
1 n 1 1 ) = n i =1 xi
n 1 x i =1 in
,
przy czym:
xi =1
n
1i
0.
Dla wszystkich zmiennych, wyraonych co najmniej na skali porzdkowej, mona wyznacza nieklasyczne miary tendencji centralnej. Nale do nich:
7| Strona
Statystyka laboratorium 4
-mediana, -dominanta (moda), -kwantyle. Mediana (zwana te wartoci rodkow) to w warto w szeregu uporzdkowanym, powyej i poniej ktrej znajduje si jednakowa liczba wartoci zmiennej. Dominanta (moda) - to najczciej wystpujca warto zmiennej. Kwantylem rzdu p (Kp), gdzie 1 > p > 0, nazywamy kad liczb xp przed, ktr znajduje si 100p% wartoci zmiennej. Kwantyle dla p = 0,25, p = 0,5, p = 0,75 nazywany kwartylami. Gdy: p = 0,25 kwartyl dolny (inaczej kwartyl rzdu 1 oznaczany przez Q1, percentyl 25), p = 0,5 - mediana (inaczej kwartyl rzdu 2, percentyl 50), p = 0,75 kwartyl grny ( inaczej kwartyl rzdu 3 oznaczany przez Q3, percentyl 75). Miary zmiennoci (rozproszenia, dyspersji) Miary zmiennoci dzielimy na: Miary klasyczne: - wariancja (dla zmiennych, ktre mona mnoy), - odchylenie standardowe(dla zmiennych, ktre mona mnoy), - odchylenie przecitne (dla zmiennych, ktre mona dodawa), - wspczynnik zmiennoci (dla zmiennych, ktre mona mnoy i dzieli), Miary pozycyjne: - rozstp (dla zmiennych, ktre mona dodawa), - odchylenie wiartkowe (dla zmiennych, ktre mona dodawa),, - wspczynnik zmiennoci.2 Wariancj S x wyznaczamy ze wzoru: 2 Sx =
1 n ( xi x ) 2 , n 1 i =1 S x = S x2 .
odchylenie standardowe:
Odchylenie standardowe informuje o ile rednio odchylaj si wartoci zmiennej od wartoci redniej x . Im mniejsza warto odchylenia tym wartoci zmiennej s bardziej skupione wok redniej. Rozstp R to warto bezwzgldna (modu) rnicy pomidzy wartoci maksymaln i minimaln badanej zmiennej.
R = max( x1 , x 2 ,..., x n ) min( x1 , x 2 ,..., x n )Odchylenie wiartkowe Q (rozstp midzykwartylowy) - jest to wielko okrelajca odchylenie wartoci zmiennej od mediany. Mierzy poziom zrnicowania tylko czci jednostek; po odrzuceniu jednostek o wartociach niewikszych ni Q1 oraz jednostek o wartociach niemniejszych ni Q3. Im wiksza szeroko rozstpu wiartkowego, tym wiksze zrnicowanie wartoci zmiennej.
Q=
Q3 Q1 2
.
Wspczynnik zmiennoci wyznacza si ze wzoru ZM x = Miary asymetrii
Sx , x 0. x
Istnieje wiele miar sucych do wyznaczania asymetrii rozkadu do najczciej stosowanych naley trzeci moment centralny , ktry wyznacza si ze wzoru:
8| Strona
Statystyka laboratorium 4 M3 = 1 n ( xi x ) 3 , n i =1
lub wspczynnik skonoci
WM 3 =
M3 3 . Sx
Wspczynnik skonoci przyjmuje warto zero dla rozkadu symetrycznego, wartoci ujemne dla rozkadw o lewostronnej asymetrii (wyduone lewe rami rozkadu) i wartoci dodatnie dla rozkadw o prawostronnej asymetrii (wyduone prawe rami rozkadu). Miary koncentracji Miary koncentracji mierz koncentracj wartoci zmiennej wok redniej. Do najczciej stosowanych wspczynnikw koncentracji naley kurtoza Definiuje si j nastpujcym wzorem:
Kurt =
M4 3, 4 Sx M4 = 1 n ( xi x ) 4 . n i =1
gdzie M 4 nazywane czwartym momentem centralnym wyznacza si ze wzoru:
Rozkady zmiennych mona podzieli ze wzgldu na warto kurtozy na rozkady: mezokurtyczne - warto kurtozy wynosi 0, spaszczenie rozkadu jest podobne do spaszczenia rozkadu normalnego (dla ktrego kurtoza wynosi dokadnie 0) leptokurtyczne - kurtoza jest dodatnia, wartoci cechy bardziej skoncentrowane ni przy rozkadzie normalnym (wykres wysmuky) platokurtyczne - kurtoza jest ujemna, wartoci cechy mniej skoncentrowane ni przy rozkadzie normalnym (wykres spaszczony). Zadanie 3. Analiza statystyczna zmiennej jakociowej wyraonej w skali nominalnej Przeprowadzi analiz zmiennej Miejscowo zamieszkiwana. Aby wyznaczy statystyki mona jedynie posugiwa si zmiennymi liczbowymi a wic analiz bdziemy przeprowadza na zmiennej kod_miejscowo. W tym celu wybieramy zakadk Statystyka, Statystyki opisowe i Zmienne, oraz wybieramy zmienne, ktre maj by poddane analizie.
9| Strona
Statystyka laboratorium 4
Po wybraniu zmiennej OK. oraz Wicej. Pojawi si ponisza tabela w ktrej wybieramy statystyki zgodnie z rodzajem skali pomiarowej w jakiej wyraona jest badana zmienna.
10 | S t r o n a
Statystyka laboratorium 4
Jako Posumowanie otrzymujemy wartoci zaznaczonych statystyk w postaci poniszego arkusza, ktry mona przekopiowa do dokumentu np. Worda.
Moemy take otrzyma tabel licznoci ( szereg przedziaowy) dla badanej zmiennej
11 | S t r o n a
Statystyka laboratorium 4
W postaci poniszego arkusza:
Dodatkowo mona wykona histogram badanej zmiennej.
Za pomoc Wykresy 1
12 | S t r o n a
Statystyka laboratorium 4
Za pomoc Wykres 2:
Za pomoc Histogramy:
13 | S t r o n a
Statystyka laboratorium 4
Jeli chcemy uzyska wykres innego typu wybieramy na wstce Wykresy. Jeli na przykad chcemy uzyska wykres koowy to wybieramy Wykresy 2W a nastpnie Wykresy koowe.
14 | S t r o n a
Statystyka laboratorium 4
3 1
2
k o d _ m
ie js c o w
o
Jeli na wykresie maj by umieszczone licznoci, procenty i ewentualne nazwy, klikamy prawym klawiszem myszy i w tabeli Opcje wykresu zaznaczamy Etykiety punktw oraz Licznoci, Procenty, Nazwy klas.
15 | S t r o n a
Statystyka laboratorium 4
Wynikiem naszego dziaania bdzie wykres w postaci:
3
;
3
5
;
1
8 % 1 ; 6 2 ; 3 1 %
2
;
1 0
3
;
5
2
%
k o
d
_
m
i e
j s
c
o
w
o
Ten sam wykres koowy dla zmiennej niekodowanej Miejscowo zamieszkiwana ma posta:
16 | S t r o n a
Statystyka laboratorium 4
m
i a
s
t o
;
3
5
;
1
8
% w i e ; 6 2 ; 3 1 %
g
m
i n
a
;
1
0
3
;
5
2
%
M
i e
j s
c
o
w
o
z a
m
i e
s
z k i w
a
n
a
Zadanie 4. Analiza statystyczna zmiennej jakociowej wyraonej w skali porzdkowej Przeprowadzi analiz statystyczn zmiennej Wyksztacenie i utworzy histogram . Zmienna Wyksztacenie zostaa zakodowana i zapisana jako zmienna kodwyksz. Przeprowadzimy wic analiz zmiennej kodwyksz. Wyniki analiz ( wykresy i tabele) umie w dokumencie Word. Poniewa na kodach nie mona wykonywa dziaa arytmetycznych naley wybra tylko te statystyki, ktre mona wyznaczy. W stosunku do skali nominalnej, dla skali porzdkowej mona jeszcze dodatkowo wyznaczy kwantyle. Wyniki analiz ( wykresy i tabele) umie w dokumencie Word i zinterpretuj wszystkie otrzymane wyniki.
Zadanie 5. Analiza statystyczna zmiennej ilociowej Przeprowadzi analiz statystyczn zmiennej Waga oraz wykona histogram z krzyw normaln. Dla zmiennej Waga wyraonej w skali ilorazowej mona wyznaczy wszystkie statystyki oferowane przez program STATISTICA Przekopiowa do Worda histogram i otrzymane tabele oraz zinterpretowa wszystkie wyznaczone wartoci statystyk.