16
Проверка качества Проверка качества спецификации спецификации модели модели

Проверка качества спецификации модели

  • Upload
    glora

  • View
    75

  • Download
    1

Embed Size (px)

DESCRIPTION

Проверка качества спецификации модели. Качество спецификации модели. Под качеством спецификации модели понимается: - качество выбора функции уравнения регрессии; - качество выбора набора регрессоров (факторов) Пусть имеем модель в виде уравнения парной регрессии: - PowerPoint PPT Presentation

Citation preview

Page 1: Проверка качества спецификации модели

Проверка Проверка качества качества

спецификации спецификации моделимодели

Page 2: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

Под качеством спецификации модели понимается:Под качеством спецификации модели понимается:

- качество выбора функции уравнения регрессии;- качество выбора функции уравнения регрессии;

- качество выбора набора регрессоров (факторов)- качество выбора набора регрессоров (факторов)

Пусть имеем модель в виде уравнения парной Пусть имеем модель в виде уравнения парной регрессии:регрессии:

YYtt = a = a00 + a + a11xxtt + u + utt (11.1)(11.1)

Задача:Задача: оценить степень влияния экзогенной оценить степень влияния экзогенной переменной Х (фактора) на величину эндогенной переменной Х (фактора) на величину эндогенной переменной переменной YY..

Другими словами: насколько правильно предположение, Другими словами: насколько правильно предположение, что поведение эндогенной переменной зависит от что поведение эндогенной переменной зависит от значения фактора Х.значения фактора Х.

Page 3: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

В качестве меры влияния принимаются В качестве меры влияния принимаются дисперсии переменных дисперсии переменных Y, XY, X и и u.u.

Знаем, что уравнение регрессии Знаем, что уравнение регрессии описывает поведение среднего описывает поведение среднего значения эндогенной переменнойзначения эндогенной переменной::

Y* = aY* = a00 + a + a11xxtt (11.2)(11.2)

Тогда уравнение (11.1) можно записать Тогда уравнение (11.1) можно записать как:как:

YYtt = Y* = Y*tt +u +utt (11(11..3)3)

Page 4: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

),(2*2*2*22

uYuYuYY tttttttCOV

0,,,),(1010

* uxauauxaauY tttttttCOVCOVCOVCOV

Вычислим дисперсию Y в уравнении (11.3)

Вычислим COV(Yt*,ut):

Таким образом,

uYuYY ttttt 2*2*22 (11.4)

Page 5: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

Введем обозначения:

uuYY

Y

tt

t

t

uESS

RSS

YTSS

22

2**

2

Здесь: TSS – общая сумма квадратов эндогенной переменной (Total sum of squares )

RSS – регрессионная сумма квадратов (Regression sum of squares

ESS – сумма квадратов остатков (ошибок) (Error sum of squares

Page 6: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

С учетом принятых обозначений выражение (11.4) можно записать в виде:

TSS = RSS + ESS (11.4)

В качестве показателя степени влияния выбранного регрессора на поведение эндогенной переменной принимается отношение:

TSS

ESS

TSS

RSSR 1

2(11.5)

R2 – называется коэффициентом детерминации

Page 7: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

Замечание. Коэффициент детерминации R2 имеет смысл (определен) только для моделей, в спецификации которой присутствует коэффициент a0.

Если коэффициент a0 отсутствует, то нарушается равенство (11.4).

Поясним это графически.

0

1

2

3

4

5

6

7

8

9

0 2 4 6 8 10 12

Y=0.786x

Y=2+0.5x

TSS=RSS=2.625

ESS=0

TSS=2.625

RSS=237.7

ESS=8.57

TSS≠RSS+ESS

Page 8: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

Если R2 =1, т.е. RSS=TSS, a ESS=0, то такая модель называется «абсолютно хорошей». Это означает, что выбранный регрессор полностью объясняет поведение эндогенной переменной.

Если R2 =0, т.е. RSS=0, а ESS=TSS, то такую модель называют «абсолютно плохой». В этом случае весь диапазон изменения эндогенной переменной объясняется влиянием случайного возмущения, а выбранный регрессор не оказывает влияния, не объясняет поведение эндогенной переменной.

Page 9: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

Отметим следующее:

R2 – величина случайная, т.к. его конкретное значение вычисляется по результатам случайной выборки

Это означает, что полученное значение коэффициента детерминации отличное от нуля еще не является достаточным основанием считать модель качественной.

Необходимо проверить статистическую гипотезу о равенстве нулю R2: (H0: R2=0).

Внимание! Формулируется гипотеза о равенстве нулю R2, т.е гипотеза о том, что модель плохая.

Page 10: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

Для проверки гипотезы H0: R2=0 :

1. Формируем случайную величину с известным законом распределения

1

12

2

kn

k

R

RF Test (11.6)

где: к - количество регрессоров в модели

n – количество наблюдений в выборке

Случайная величина FTest подчиняется закону распределения вероятностей Фишера.

Критическое значение зависит от уровня доверительной вероятности и двух параметров: k и (n-k-1).

Page 11: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

Для проверки гипотезы H0: R2=0 :

2. Вычисляется по данным выборки значение FTest.

3. Находится по таблице значение Fкр(Pдов, k, n-k-1).

4. Сравниваются значения Fкр и FTest.

Если FTest ≤ Fкр

то гипотеза H0: R2=0 не отвергается

Значит модель имеет плохое качество спецификации.

Т.е. выбранный регрессор не объясняет поведение эндогенной переменной.

Замечание. Значения R2 и FTest вычисляются функцией «ЛИНЕЙН» в EXCEL.

(11.7)

Page 12: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

Yt Xt ỹt

8,8 0,36 12,5

9,4 0,21 11,4

10,0 0,08 10,4

10,6 0,20 11,3

11,0 0,10 10,5

11,9 0,12 10,7

12,7 0,41 12,9

13,5 0,50 13,6

14,3 0,43 13,1

15,5 0,59 14,3

16,7 0,90 16,6

18,6 0,82 16,0

19,7 1,04 17,7

21,1 1,53 21,4

22,8 1,94 24,6

23,9 1,75 23,1

25,2 1,99 24,9

26,0 2,03 25,3

26,8 2,40 28,1

0,0

5,0

10,0

15,0

20,0

25,0

30,0

0,00 0,50 1,00 1,50 2,00 2,50 3,00

Пример. Зависимость сбережений граждан (Y) от размера располагаемого дохода в Великобритании

7,617566 9,787071

0,465248 0,552221

0,940367 1,531286

268,0791 17

628,602 39,86224

R2

FTest

Результат «ЛИНЕЙН»

Fкр=F(0.95,1,17)=4.4

FTest > Fкр

Вывод: Спецификация модели качественная

Диаграмма рассеяния и график модели

Page 13: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

Замечание. Значения коэффициента детерминации растет с увеличение числа регрессоров.

В случае модели в виде уравнения множественной регрессии применяется модифицированный коэффициент детерминации Ř2:

RR kn

n 221

11

(11.8)

Здесь: R2 - коэффициент детерминации в форме (11.5)

n – объем выборки

k – количество регрессоров в модели

Page 14: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

Замечание. При анализе модели в виде уравнения множественной регрессии принятие гипотезы H0: R2=0 означает, что все регрессоры не объясняют (не влияют) поведение эндогенной переменной.

Отклонение гипотезы H0: R2=0, означает, что не все регрессоры объясняют (влияют) поведение эндогенной переменной.

Другими словами, в составе выбранных на этапе спецификации модели регрессоров есть как влияющие, так и не влияющие регрессоры.

Вопрос. Как определить влияющие и не влияющие регрессоры?

Ответ. Необходимо проверить гипотезу H0: ai=0

Page 15: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

Проверка статистической гипотезы H0: ai=0

Известно, что в схеме Гаусса-Маркова дробь (11.9) подчиняется закону распределения Стьюдента ai

ic

t a

(11.9)

где: ãi – оценка i-го параметра модели

с – заданная константа

σai-оценка стандартной ошибки оценки параметра

В данном случае с=0, т.е. сравнивается вычисленное значение оценки с нулем.

Если гипотеза не отвергается для i-го регрессора, то этот регрессор не оказывает влияние на эндогенную переменную и его можно исключить из уравнения модели.

Page 16: Проверка качества спецификации модели

Качество спецификации моделиКачество спецификации модели

№ п/п Yt Xt Pt № п/п Yt Xt Pt

1 171,3 1095,4 99,7 14 106,4 779,2 100,0

2 167,5 1058,3 96,7 15 102,0 751,6 99,6

3 164,8 1049,3 94,2 16 98,4 722,5 100,0

4 159,8 1021,6 93,0 17 93,5 701,3 100,9

5 154,8 1015,5 93,8 18 85,3 646,8 102,6

6 148,5 988,8 94,7 19 81,6 616,3 104,0

7 141,3 942,9 94,5 20 77,4 580,8 104,5

8 134,9 906,8 93,7 21 74,0 542,3 104,8

9 89,1 873,5 102,2 22 70,7 524,9 105,0

10 128,3 875,8 93,3 23 67,0 503,8 105,1

11 118,2 865,3 99,1 24 64,0 489,7 104,5

12 124,2 858,4 95,1 25 60,9 479,7 104,5

13 112,5 810,3 100,0

-1,274 0,1509 119,59

0,787 0,0172 90,161

0,9459 8,6976 #N/A

192,42 22 #N/A

29112 1664,3 #N/A

Расходы на жилье (Y) от располагаемого дохода (Х) и цен на жилье (Р)

Модель 1:

Y=a0+a1x+a2p+u

-7,2 823,9

0,8 84,0

0,8 18,0

72,0 23,0

23323,4 7452,8

ti= 1.62 8.74 1.33

ti= 9.8 8.5

Модель 2:

Y=a0+bp+v

Выводы: регрессор x2 не значим, его можно убрать

модель 2 качественно объясняет поведение Y