48
Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен модел. Изследване на корелационни и регресионни зависимости Типове данни. Подготовка на статистическите данни. Етапи от построяване на иконометричния модел. Регресионни модели. Корелационен анализ. Проверка за нормалност на данните. Регресия по метода на най-малките квадрати. Корелационен и регресионен анализ с SPSS. Изследване на грешките.

Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

  • Upload
    others

  • View
    25

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

Иконометрия Лекция 4

проф. д-р Снежана Гочева-Илиева

Построяване на иконометричен модел. Изследване на корелационни и регресионни зависимости

Типове данни. Подготовка на статистическите данни. Етапи от

построяване на иконометричния модел. Регресионни модели. Корелационен анализ. Проверка за

нормалност на данните. Регресия по метода на най-малките квадрати. Корелационен и регресионен анализ с SPSS. Изследване на грешките.

Page 2: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

2

Типове данни При моделиране на икономически процеси има 2 основни типа

данни: Пространствени данни Временни редове

Пространствени данни са стойности на някаква наблюдавана величина X , без отчитане на времето, като подредбата им не влияе на изучаването им. Означават се с 1 2, ,..., nx x x . Пример 1. Данни за бройки реализирани продажби на компютри в 10 офиса на фирмата за текущия ден. Временните редове са стойности 1 2, ,..., Tx x x на наблюдаваната променлива, съответстващи на последователни равномерни периоди във времето (по години, тримесечия, дни, часове и др.). За разлика от

Page 3: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

3

пространствените данни, временните редове отразяват динамиката на изследваната величина с течение на времето. Пример 2. Регистрираните количества продажби на компютри, съответно за отделните месеци в годината. Пример 3. Ежедневните курсове на долара.

Page 4: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

4

Подготовка на статистическите данни Събиране на необходимия обем данни (сурови данни) Представяне на стойностите на икономическите и други

променливи в необходимия вид (кодиране като номинални, интервални и др.; стандартизиране; преобразуване с логаритмична или друга трансформация и т.н.)

Начална обработка на данните за установяване на особености, липсващи данни, нееднородност на пространствени данни, изследване за стационарност на временните данни и др.

Провеждане на описателен и графичен анализ.

Page 5: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

5

Етапи на построяване на иконометричния модел 1) Икономическа обосновка и идентификация, икономически

критерии 2) Съставяне на иконометричен модел 3) Подготовка на данни 4) Оценка на параметрите на модела 5) Тестване 6) Проверка за адекватност 7) Използване на модела за предсказване

Процесът на построяване на иконометричния модел е итерационен.

Възможно е циклично повтаряне на отделни етапи за подобряване и коригиране на модела, промяна на данните при постъпване на нови данни и др.

Page 6: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

6

РЕГРЕСИОННИ МОДЕЛИ

Регресионният анализ е един от най-мощните в статистическата теория и практика, и широко се използва и в иконометрията. Целта му е установяване наличието и посоката на връзка между две и повече променливи.

Възможни са няколко варианта: Съществува връзка от тип „Причина – следствие“ Наличие на „лъжлива връзка Причина-следствие“ Не съществува връзка между променливите.

Като начален етап от регресионния анализ ще разгледаме

корелационния анализ.

Page 7: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

7

Корелационен анализ Нека x е представителна извадка на генералната съвкупност (ГС) X,

a y – представителна извадка на ГС Y. Корелацията проверява наличие и посока на евентуална линейна

зависимост (корелационна зависимост) между двете генерални съвкупности X и Y. Корелационният анализ не установява зависимост „Причина-следствие“.

За да установим дали има корелационна зависимост трябва да пресметнем и оценим корелационния коефициент на ГС. Негово приближение е т.нар. извадков коефициент на корелация r.

Формулите за пресмятане на извадковия коефициент на корелация r са:

Page 8: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

8

22 2 ( )

( ) ii i

xSSx x x x

n ,

22 2 ( )

( ) ii i

ySSy y y y

n ,

( )( )( )( ) i i

i i i ix y

SSxy x x y y x yn

,

Откъдето намираме: SSxyr

SSx SSy .

Корелационният коефициент е число между -1 и 1, т.е. 1 1r . Колкото по-голяма е неговата стойност по абсолютна стойност до 1, толкова по-силна е зависимостта между x и y. Когато 0r , наличието на корелационна зависимост означава, че с нарастване на x зависимата променлива y също расте (положителна посока на връзката). Когато

0r с нарастване на x променливата y намалява (отрицателна посока на връзката).

Page 9: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

9

Практическо правило: Според големината по абсолютната стойност на корелационния коефициент се различават следните степени на корелация:

при 0.7 r казваме, че корелацията е силна, при 0.5 0.7r , тя е средна, при 0.3 0.5r корелацията е слаба при 0.3r , корелация отсъства или е много слаба.

Ако е изчислена определена степен на корелация, може да се предполага, че между x и y има зависимост, но това не е достатъчно. Изчисляването на корелационния коефициент r не е достатъчно. След неговото определяне се прави проверка за неговата значимост.

При предположение за нормално разпределени ГС: X~N(m1,1), Y~N(m2,2) се разглеждат хипотезите:

Page 10: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

10

H0: 0 , т.е. няма линейна корелационна зависимост между X и Y; H1: 0 , т.е. има линейна корелационна зависимост между X и Y. Ще отбележим специално, че ако X и Y са независими величини, то 0 . Обратното не е вярно. Равенството на нула на корелационния

коефициент означава само, че между тях няма линейна корелационна зависимост. Но е възможно да съществува нелинейна зависимост.

Page 11: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

11

За проверката на корелационните хипотези се прилага t-статистиката по разпределението на Стюдънт. Това става по следния начин:

1. Най-напред като се използва r се пресмята

2

2

1

r ntr

.

2. След това се намира t критично - квантил на t-разпределението на

Стюдънт с n-2 степени на свобода и порядък 12

q , където е

избрано ниво на значимост, напр. = 5%. Намирането на t кр. може да стане по таблици или с функцията на Excel TINV(; n-2). Степените на свобода се определят, като от размера на извадката n се извади броят на участващите променливи. В нашия случай имаме брой променливи равен на 2 (x и y).

Page 12: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

12

3. Прилага се решаващото правило:

Решаващо правило: Ако |t| > t кр., то се отхвърля основната хипотеза H0 и се приема, че X и Y са корелационно зависими (линейно!). Ако |t| < t кр. , то се приема, че X и Y са корелационно независими. Пример 1. Експериментална станция по добив на цвят от казанлъшка роза прилага нова марка течен тор за повишаване на добива от розов цвят. С различни количества тор на ар (1 дка=10 ара) са наторявани 10 ара розов масив. Набраният розов цвят (в кг) и използваните количества тор (в литри) за всеки ар са дадени в долната таблица.

Да се изследва влияе ли количеството тор на добива на розов цвят.

i, експериментален участък 1 2 3 4 5 6 7 8 9 10 x, течен тор (литри) 5 4 7 10 11 8 9 11 8 9 y, розов цвят (кг) 30 27 38 48 59 54 42 63 52 47

Page 13: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

13

Решение: Построяваме таблицата, изчисляваме сумите и заместваме във формулите за r.

i xi yi xi2 yi

2 xi*yi 1 5 30 25 900 150 2 4 27 16 729 108 3 7 38 49 1444 266 4 10 48 100 2304 480 5 11 59 121 3481 649 6 8 54 64 2916 432 7 9 42 81 1764 378 8 11 63 121 3969 693 9 8 52 64 2704 416 10 9 47 81 2209 423 Суми 82 460 722 22420 3995

Page 14: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

14

По формулите: n = 10, 2

2 ( ) 82.82722 49,610

ii

xSSx x

n

2

2 ( ) 460.46022420 126010

ii

ySSy y

n ,

( )( ) 82.4603995 22310

i ii i

x ySSxy x y

n ,

223 0,89202949,6 1260

SSxyrSSx SSy

.

Тъй като |r|>0,7 заключаваме, че има силна корелационна зависимост. Но това не е достатъчно. Необходимо е да направим проверка за значимостта на получения извадков корелационен коефициент r. При предположение за нормално разпределени ГС: X~N(m1,1), Y~N(m2,2) пресмятаме t по формулата:

Page 15: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

15

212

rnrt

5822,5

892029,018892029,0

2

. Така имаме: r = 0.892029, t = 5.5822.

Ще намерим t критично по разпределението на Стюдънт с помощта на Excel функцията TINV. В произволна клетка за =0.05 и n-2=8 степени на свобода написваме:

=TINV(0.05,8)

Получаваме t кр. = 2,306. Тъй като t > tкр., заключаваме, че съществува корелационна

зависимост между x и y (литрите използван течен тор и килограмите набран розов цвят).

Page 16: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

16

Корелация с SPSS Решение на Пример 1 с помощта на SPSS: Можем да отворим файла с данните директно от Excel, или да ги

наберем в SPSS. В прозореца Data Editor, режим определяме всички

променливи като интервални (Scale, ).

Page 17: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

17

Данните в прозореца Data Editor, режим Data View изглеждат така:

Page 18: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

18

Корелация се търси от меню: Analyze/Correlate/Bivariate

Page 19: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

19

Прехвърляме променливите вдясно с . Оставяме всички избори в междинните менюта по подразбиране. Получаваме:

Page 20: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

20

След потвърждане с системата извежда следния резултат в прозореца Viewer:

Корелационен коефициент; r=0.892 Достигнато ниво на значимост (Sig.): 0.001

Page 21: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

21

Регресия с метода на най-малките квадрати Ако с t-статистиката се установи наличието на зависимост, тя може да се определи явно като формула от вида

ˆ( )y y x с различни методи за приближаване на таблични данни. Един от най-използваните е методът на най-малките квадрати (МНМК, (OLS), Ordinary Least Squares. Това се нарича регресия, а графиката на получената зависимост – регресионна крива. Линейна регресия. Когато графиката на данните прилича на отсечка, приближаваща функция се търси като полином от първа степен във вида 0 1ˆ( )y x a a x . Коефициентите 0 1,a a се определят от линейната система

Page 22: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

22

n

iii

n

ii

n

ii

n

ii

n

ii

yxaxax

yaxna

11

1

20

1

11

10

. Квадратична регресия. Търси се приближаваща функция като полином от втора степен:

2

210)(ˆ xаxaaxy . Коефициентите 0 1 2, ,а a a се намират от линейната система

Page 23: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

23

n

iiи

n

ii

n

ii

n

n

iii

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

yxaxaxax

yxaxaxax

yaxaxna

1

22

1

41

1

30

1

2

12

1

31

1

20

1

12

1

21

10

. Формулата за грешката на приближенията по МНМК е в

средноквадратичен смисъл:

n

iii xyyR

1

2))(ˆ(.

Пример 2. По данните от Пример 1, да се определи уравнението на:

а) линейната регресия, б) квадратична регресия. Решение:

Page 24: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

24

а) Като използваме намерените суми

n

iii

n

i

n

iii

n

ii yxyxx

11 1

2

13995,460,722,82

и заместим в системата за линейна регресия, получаваме системата:

3996722824608210

10

10

aaaa

. Можем да решим системата например по метода на Крамер. Пресмятаме детерминантите

=49682.82722.10

722828210

, 1=

45303995.82722.460722399582460

,

2= 2230460.823995.10

39958246010

.

Тогава 1331,9

49645301

0

a,

4960,449622302

1

a.

Уравнението на линейна регресия е: xxy 4960,41331,9)(ˆ .

Page 25: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

25

На графиката е построена линейната зависимост по МНМК за данните от примера с помощта на Excel. Б) За да намерим квадратичната крива на регресия пресмятаме още три стълба към таблицата:

Page 26: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

26

3ix

4ix ii yx 2

125 625 750 64 256 432 343 2401 1862 1000 10000 4800 1331 14641 7139 512 4096 3456 729 6561 3402 1331 14641 7623 512 4096 3328 729 6561 3807 суми 6676 63878 36599 Съставяме системата:

Page 27: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

27

3659963878667672239966676722824607228210

210

210

210

ааааaaаaa

Нейното решение е: a0=6,8924, a1=5,1434 и a2=-0,0425. Следователно уравнението на приближаващата крива е:

20425,01434,58924,6)(ˆ xxxy .

Page 28: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

28

ПРОВЕРКА НА УСЛОВИЯТА ЗА ВАЛИДНОСТ НА КОРЕЛАЦИОНЕН И РЕГРЕСИОНЕН АНАЛИЗ Ако условията не са изпълнени, не може да прилагаме получения модел и резултати. Основните изисквания са: Нормално разпределение на извадките и в частност при линейна

регресия – нормално разпределение на зависимата променлива Ако това условие не е изпълнено се търси подходяща трансформация на данните – логаритмична, корен квадратен и др. Зависимостта в общия вид да е линейна Анализ на грешките от регресия (резидиуми), които трябва:

o Да са нормално разпределени със средно 0 и ст. откл. 1, N(0,1) o Грешките са независими o Грешките са неависими от предсказаните от модела стойности

(условие за хомоскедастичност)

Page 29: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

29

Формула за стандартизиране на променлива За да се приведе в безмерен вид: Z-scores

ii

x xzs

В SPSS набираме: Analyze/Descriptive Statistics/Descriptives, и избираме: Save standardized values as variables Показано е на следващата фигура:

Page 30: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

30

Page 31: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

31

Ще получим нова променлива:

Page 32: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

32

Проверка за нормалност на разпределението (задължително!) Използват се комбинирано два или три от следните начини:

1. Графика на честотите (хистограма) и сравняване с нормалното 2. P-P Plot (Probability-probability plot) и сравняване с нормалната

права (с наклон 450) 3. Изчисляване на коефициентите на асиметрия и ексцес, които да

са близки до нула. Например, при ниво на значимост 0.05 да са изпълнени едновременно неравенствата:

1.96, 1.96( ) ( )Sk Ku

SE Sk SE Ku ,

където ( )SE Sk е стандартната грешка на Sk ; и съответно, ( )SE Ku е стандартната грешка на Ku . Забележка. При ниво 0.01 съответно в дясната страна

ограничението е 2.58, и при 0.001 е 3.29.

Page 33: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

33

4. Емпиричен критерий за малки извадки (при n<30). 5. Непараметричен критерий на Колмогоров-Смирнов

(Kolmogorov-Smirnov) или Шапиро-Уилк (Shapiro-Wilk). Емпиричен критерий за нормалност при малки извадки (n<30). Може да се проверява по формулите:

* * * *

3*

14

*2

1

3 ( ), 3 ( ) ,

1 6( 1), ( *)( 1)( 3)

1 24 ( 2)( 3)3, ( *)( 1) ( 3)( 5)

ni

i

ni

i

Sk d Sk Ku d Ku

x x nSk D Skn s n n

x x n n nKu D Kun s n n n

Page 34: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

34

Проверка на условията в SPSS 1. Графика на честотите (хистограма) на разпределението и

сравняване с нормалното Analyze/Descriptive Statistics/Frequences:

Page 35: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

35

Появява се прозорецът Frequences. Пренасяме променливата «розов цвят в кг» в прозореца Varible(s) с бутона .

Page 36: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

36

Избираме бутона и в него както е показано по-долу. Потвърждаваме с .

Page 37: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

37

Получаваме графиката:

От хистограмата не можем категорично да заключим дали разпределението на ГС е близко до нормалното. В случая имаме малка извадка (n<30), поради което можем да ползваме емпиричния критерий.

Page 38: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

38

2. а) P-P Plot (Probability-probability plot) и сравняване с нормалната права (с наклон 450): Analyze/Descriptive Statistics/P-P Plots:

Page 39: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

39

Получаваме: Тълкуване: Тъй като точките, изразяващи натрупаните вероятности, почти лежат на 45-градуса наклонената съответна крива на нормалното разпределение и осцилират около нея без тежки опашки, то можем да заключим, че рапределението на данните за розов цвят е близко до нормалното.

Page 40: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

40

3. Изчисляване на коефициентите на асиметрия и ексцес Отново: Analyze/Descriptive Statistics/Frequences/. Пренасяме променливата „розов цвят кг“ в прозореца Varible(s) с бутона . В прозореца Frequences, избираме и в него както следва:

Page 41: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

41

След и Continue и получаваме таблицата:

Стойността на коефициента на асиметрия Skewness=-0.309, т.е. по абсолютна стойност е близо до 0. Аналогично и за Kurtosis=-0.802.

На практика се препоръчва за ниво 0.05 :

1.96, 1.96( ) ( )Sk Ku

SE Sk SE Ku .

В нашия пример имаме: 0.309 0.8020.5 1.5, 0.601 1.5

0.687 1.334

и можем да заключим, че разпределението е близо до нормалното.

Page 42: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

42

4. В по-специфични случаи, когато горните оценки за асиметрия и ексцес не са така категорчни, се препоръчва пресмятанията им по емпиричния критерий. В SPSS няма вградени функции за целта. Изисленията се правят ръчно или с Excel.

5. Критерий на Колмогоров-Смирнов и Шапиро-Уилк:

За нормално разпределение значимостта на хипотезата H0 трябва да е: Sig. >0.05! Обърнете внимание, че при тези тестове разпределението е нормално, когато са незначими. По принцип тези тестове са по-ефективни при извадки с размер в рамките на 30<n<2000.

Page 43: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

43

Анализът се извършва от: Analyze/Descriptives/Explore

Page 44: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

44

Отваря се прозорецът Explore, тук пренасяме променливата „розов цвят кг“ в полето Dependent List.

Page 45: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

45

Избираме бутона . Появява се прозорецът за графики, където избираме, както е показано:

Page 46: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

46

В прозореца за изход (IBM Statistics Viewer) получаваме няколко резултата, в т.ч. тестовете за нормалност: Kolmogorov-Smirnov (K-S test) с Lilliefors Sig. Correction и Shapiro-Wilk.

Значимостта и на двата теста е над 0.05:

За Колмогоров-Смирнов теста: Sig. =0.200>0.05, за Шапиро-Уилк: Sig. =0.854>0.05. Заключение: H0 отпада, т.е. дадената извадка идва от нормално

разпределена генерална съвкупност.

Page 47: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

47

Забележка 1. Тестът на Шапиро-Уилк се счита за по-точен.

Понякога има разлика в пресметнатите коефициенти на значимост и трябва да се прави по-прецизна проверка. Забележка 2. Не трябва да се смесва този анализ с непараметричния

тест от: Analyze/Nonparametric Tests/Legacy Dialogs/1-Sample K-S…, където се пресмята т.нар. Kolmogorov-Smirnov Z тест, който е без Лилиефорс поправката.

Page 48: Лекция 4 - fmi-plovdiv.org...Иконометрия Лекция 4 проф. д-р Снежана Гочева-Илиева Построяване на иконометричен

48

Освен таблицата за нормалност в прозореца на предния анализ Explore се получава и графика Stem and leaf на разпределението «по порции»:

В идеалния случай трябва хоризонталната средна линия (медианата) да е по средата. Служи също са показване на отдалечени случаи (outliers). За изследвания пример можем да заключим, че разпределението е нормално.