Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ ПРОВЕРКИ...

Preview:

DESCRIPTION

Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ. КРИТЕРИИ, ОСНОВННЫЕ НА ОТНОШЕНИИ ПРАВДОПОДОБИЯ. Книга Бытие, глава 8 Воды убывали; ворон; выпуск голубя (1-14) … - PowerPoint PPT Presentation

Citation preview

Лекция 1. ПОСЛЕДОВАТЕЛЬНЫЕ КРИТЕРИИ

ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ.

КРИТЕРИИ, ОСНОВННЫЕ НА ОТНОШЕНИИ

ПРАВДОПОДОБИЯ

Книга Бытие, глава 8Воды убывали; ворон; выпуск голубя (1-14)

8 Потом выпустил от себя голубя, чтобы видеть, сошла ли вода с лица земли,9 но голубь не нашел места покоя для ног своих и возвратился к нему в ковчег, ибо вода была еще на поверхности всей земли; и он простер руку свою, и взял его, и принял к себе в ковчег.10 И помедлил еще семь дней других и опять выпустил голубя из ковчега.11 Голубь возвратился к нему в вечернее время, и вот, свежий масличный лист во рту у него, и Ной узнал, что вода сошла с земли.12 Он помедлил еще семь дней других и выпустил голубя; и он уже не возвратился к нему.13 Шестьсот первого года к первому дню первого месяца иссякла вода на земле; и открыл Ной кровлю ковчега и посмотрел, и вот, обсохла поверхность земли.14 И во втором месяце, к двадцать седьмому дню месяца, земля высохла.

2

3

Проверка гипотезы о виде распределения

Пусть x1, x2, x3,… - последовательность независимых наблюдений

случайной величины ξ.

Гипотезы о виде распределения ξ:

0 0 0

1 1 1

: ( ) ( , )

: ( ) ( , )

H f x f x

H f x f x

• Критерий Неймана-Пирсона (1933)

• Критерий Вальда (1947)

• Проблема Кифера-Вейсса (1957)

• Критерий Айвазяна (1965)

• Критерий Лордена (1976)

4

1c

n

n

1 2 3 4 5 6

0c

H1

0H

0 ( )0 0: , ln

1H nn c c

* ( )0 1: n

n c c

Области принятия проверяемых гипотез и область неопределенности:

Статистика критерия:1( )

1 0

( )ln

( )

nn

i

f xif xi

0 ( )1 1

1: , lnH n

n c c

Критерий Вальда (SPRT)

Абрахам Вальд (1902-1950)

Теорема 1. (А. Вальд, Дж. Вольфовиц, 1948)

Пусть T – последовательный критерий отношения вероятностей с критическими границами - < c0 < 0 < c1 < + , с вероятностями ошибок первого и второго рода и , а Т- другой критерий с вероятностями ошибок первого и второго рода и .

Если

и и (1)

E[n|H0]< и E[n|H1]< (2)

Тогда

E[n|H0] E[n|H0] и E[n|H1] E[n|H1] (3)

Г. Саймонс (1976) доказал возможность заменить условие (1) на (4)

+ + (4)

5

Оптимальность критерия Вальда

1. Проверка сложной гипотезы

J. Kiefer and L. Weiss. Some properties of Generalized Sequential Probability Ratio Tests.Ann. Math. Stat., 28(1):57–75, March 1957.

2. Нарушение предположений об независимости наблюдений

Matthew Finkelman (2008): The Wald–Wolfowitz Theorem Is Violated in Sequential Mastery Testing, Sequential Analysis: Design Methods and Applications, 27:3, 293-303

6

Потеря оптимальности критерия Вальда

7

Средний объем выборки в критерии Вальда

0 1

0 1 0 1

10 1 1 0 1 0

0

2 ( , ) 2 ( , )( , ) ( , )

( , ) ( , )

( , ) ( ) ln ( ) ( )

H HE n E nH H H H

fH H f f dx H H

f

Теорема 2. (Вальда, 1947)

Оценка снизу среднего числа наблюдений для любого последовательного критерия с вероятностями ошибок α и β имеет вид:

Теорема 3. (С.А. Айвазян, 1959).

Если f0(x)=f1(x) и 1 0, то при выполнении ряда условий

0 1

0 1

1

0

( , ) ( , )( , ) ( , )

( ) ( )

( )1( , ) (1 ) ln ln , ( ) ( ) ln

1 ( )

H H

i i

E n E nH H

f xx xx y x x H f x dx

y y f x

8

Распределение объема выборки в критерии Вальдапри проверке гипотез «нормальное-логистическое»

0

1

0 1

( ) 0.010496503

( ) 0.01436227472

( , ) 0.0248587772

0.05

( , ) ( , ) 2,649995

H

H

H H

0

1

( , ) 252

( , ) 184

( , ) 213i

H

H

H

E n

E n

E n

Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1)

9

Усечение последовательного критерия отношения правдоподобия

1. Потеря оптимальности

2. Нестатистические причины прекращения эксперимента Высокая стоимость экспериментов Этические причины в клинических испытаниях …

10

Обобщенный последовательный критерий отношения правдоподобия (GSPRT)

L. Weiss. Testing one simple hypothesis against another // Ann. Math. Stat., 24(1953): pp. 273-281.

0 ( )0: ( )H n

n c n

* ( )0 1: ( ) ( )n

n c n c n

Области принятия проверяемых гипотез и область неопределенности:

0 ( )1: ( )H n

n c n

11

Armitage, P. (1957). Restricted sequential procedures. Biometrika, 44, 9–56.

12

Hemanta K. Baruah & G.P. Bhattacharjee (1980): A generalization ofanderson's modified sequential probability ratio test, Journal of Statistical Computation and Simulation, 11:3-4, 197-208

13

Jennison C., Turnbull B.W.: Group sequential methods with applications to clinical trials. Boca Raton, Chapman & Hall, 2000.

14

n

1c

1 2 3 4 5 6

0c n*

n

H1

H0

0 ( )0 0

1: 1 , 2ln

*H nn

nc c

n

Области принятия проверяемых гипотез и область неопределенности:

1 ( )1 1

1: 1 , 2ln

*H nn

nc c

n

* ( )

0 1: 1 1nn

n nc c

n n

10 1 1 0

0

( , ) ( ) lnf

H H f f dxf

- граница усечения

Критерий Айвазяна

0 1

8ln(min( , ))

( , )n

H H

Айвазян С.А.

Anderson, T.W. (1960). A modification of the sequential probability ratio test to reduce the sample size. Ann. Math. Statist., 31, 165–197.Айвазян С.А. Различение близких гипотез о виде распределения в схеме обобщенного последовательного критерия // Теория вероятностей и ее применения Том X, №4 (1965) с. 713-725

15

( )0

1 1 0 0: , ln1

nHn c c

Области принятия проверяемых гипотез и область неопределенности:

2 2 0 1: (1 )H f f f

2 0 2 1: ( , ) ( , )f f f f

( )1

0 0 1 1

1: , ln

nHn c c

* ( ) ( )0 0 1 1 1 0: , :n n

n c c

Статистики критерия: 2 1( ) ( )0 1

1 10 2

( ) ( )ln , ln

( ) ( )

n nn n

i i

f x f xi if x f xi i

0 2 2 1| , |H H H H

Критерий Лордена (2-SPRT)

Гарри Лорден

16

Оценивание точных критических границ методом Монте-Карло

В работе Canner, P.L. (1977). Monitoring treatment differences in long-term clinical trials. Biometrics, 33, 603–615. применялся метод Монте-Карло для нахождения точных критических границ в последовательном критерии для биномиального закона распределения.

В работах Гродзенской И.С. (2004) применялся метод Монте-Карло для сравнения критериев Вальда, Айвазяна, Лордена и Павлова.

Постовалов С. Н. Проверка простых и сложных гипотез с использованием последовательного критерия Вальда// ДОКЛАДЫ АН ВШ РФ. - 2011. - № 2(17). - С.140-150.

Постовалов С. Н. Проверка простых и сложных гипотез с использованием последовательных критериев Лордена и Айвазяна / С. Н. Постовалов, М. Р. Шахмаметова // Научный вестник НГТУ. - Новосибирск, 2011. - № 3 (44). - C. 17-28.

1

0 0 0 0 1 01 1

1 | ,i

i ji j

P H H P с с с H

1

1 1 1 0 1 11 1

1 | , |i

i ji j

P H H P с с с H

Но это представляет собой сложную задачу, т.к. i j если i>j.зависит от

Если нам нужно найти точные границы, мы должны вычислить вероятности ошибок первого и второго рода:

Вычисление вероятностей ошибок первого и второго рода для критерия Вальда

17

1. Выбирается область моделирования. 2. Строится сетка с маленьким шагом на выбранной области.3. Моделируется случайная величина по H0 .4. Вычисляется статистика критерия. 5. Проверяется условие выхода для каждой точки сетки (с0,с1). 6. Если для какой-то точки сетки условие выхода не выполнено, то перейти на шаг 3.7. Шаги 3-6 повторяются N раз.

8. Для каждой точки сетки вероятность ошибки вычисляется по формуле

18

0 1( , )число ошибок

c cN

Вычисление вероятностей ошибок первого и второго рода для критерия Вальда методом Монте-Карло

Какое число повторений надо взять, чтобы отклонение эмпирической вероятности ошибки первого рода от истинного значения не превосходило заданного уровня ?Согласно центральной предельной теореме

где m – количество ошибок первого рода в серии из N повторов.Отсюда

Например, если тогда

19

22

(1 ),N t

2 ( ) 1 ,m

P Ф NN

2

11 t

0.99, 0.01, 0.15 8 460N

Выбор числа повторений N

20

2

0

1 ( ): ( ) exp , 0

22

xH f x

Нормальный закон распределения:

Логистический закон распределения:

3

1 2

3

e: ( )

31 e

x

xH f x

Проверяемые гипотезы

Критерий Лордена

min(α,β) 0.05 0.1 0.15

n* 964 741 610

Критерий Айвазяна

2

0

1 ( ): ( ) exp , 0

22

xH f x

3

1 2

3

e: ( )

31 e

x

xH f x

2 0 2 1 2 0 1

10 1 1 0

0

: ( , ) ( , ), (1 )

0.5526149445( , ) ( ) ln

f f f f f f f

fH H f f dx

f

21

Расчет параметров критериев Лордена и Айвазяна

0 1( , ) 0.0248587772H H

(с0, с1)

0

1

: (0,1)

: 0,1

H N

H Log

22

(с0, с1)

0

1

: (0,1)

: 0,1

H N

H Log

23

24

Вычисление точных критических границ для критерия Вальда

α β 0.15 0.10 0.05 0.010.15 -1.67, 1.42 -2.07, 1.47 -2.74, 1.52 -4.33, 1.56

0.10 -1.72, 1.81 -2.12, 1.86 -2.80, 1.91 -4.39, 1.95

0.05 -1.78, 2.48 -2.18, 2.54 -2.85, 2.59 -4.45, 2.63

0.01 -1.82, 4.11 -2.22, 4.17 -2.89, 4.23 -4.48, 4.26

25

Вычисление точных критических границ для критерия Вальда

26

Вычисление точных критических границ для критерия Лордена

α β 0.15 0.10 0.05 0.010.15 -1,18;0,95 -1,47; 1,02 -2,00; 1,14 -3,24; 1,29

0.10 -1,25; 1,23 -1,56; 1,31 -2,10; 1,44 -3,36; 1,62

0.05 -1,36; 1,75 -1,68; 1,86 -2,23; 1,98 -3,53; 2,21

0.01 -1,50; 2,98 -1,85; 3,11 -2,43; 3,29 -3,77; 3,55

27

Вычисление точных критических границ для критерия Лордена

28

Вычисление точных критических границ для критерия Айвазяна, n*=964

α β 0.15 0.10 0.05 0.010.15 -1,9; 1,59 -2,48; 1,68 -3,69; 1,81 ----

0.10 -2,02; 2,11 -2,61; 2,20 -3,89; 2,35 ----

0.05 -2,15; 3,12 -2,82; -4,14;3,48 ----

0.01 --- --- ---- ----

29

Вычисление точных критических границ для критерия Айвазяна, n*=964

30

Распределение объема выборки в критерии Вальдапри использовании приближенных границ

0

1

0 1

( ) 0.010496503

( ) 0.01436227472

( , ) 0.0248587772

0.05

( , ) ( , ) 2,649995

H

H

H H

0

1

( , ) 252

( , ) 184

( , ) 213i

H

H

H

E n

E n

E n

Средний объем выборки по 100000 реализаций равен 267 (при H0) и 232 (при H1)

31

Распределение объема выборки в критерии Вальдапри использовании оценок точных границ

Средний объем выборки по 100000 реализаций равен 251 (при H0) и 206 (при H1) Сокращение среднего объема выборки на 6% (при H0) и на 11% (при H1)

0,05089

0,05006

0,04712

0,03467

32

Распределение объема выборки в критерии Лорденапри использовании оценок точных границ

Ср. объем выборки по 100000 реализаций равен 367 (при H0) и 318 (при H1) – приб.Ср. объем выборки по 100000 реализаций равен 268 (при H0) и 223 (при H1) –точн.Сокращение среднего объема выборки на 27% (при H0) и на 30% (при H1)

0,04986

0,05038

0,02469

0,01776

33

Распределение объема выборки в критерии Айвазянапри использовании оценок точных границ (n*=964)

Ср. объем выборки по 100000 реализаций равен 355 (при H0) и 312 (при H1) – приб.Ср. объем выборки по 100000 реализаций равен 265 (при H0) и 214 (при H1) –точн.Сокращение среднего объема выборки на 25% (при H0) и на 31% (при H1)

0,04999

0,0513

0,03026

0,02044

34

267

355367

251265 268

0

50

100

150

200

250

300

350

400

Критерий Вальда Критерий Айвазяна Критерий Лордена

Ср

едн

ий

об

ъем

вы

бо

рки

СОВ, приближенные границы

СОВ точные границы

Сравнение среднего объема выборки для разных критериев (при H0, вероятности ошибок первого и

второго рода равны 0.05)

35

Сравнение распределений объема выборки для разных критериев (при H0, вероятности ошибок первого и

второго рода равны 0.05) – приближенные границы

36

Сравнение распределений объема выборки для разных критериев (при H0, вероятности ошибок первого и

второго рода равны 0.05) – точные границы

37

Сравнение среднего объема выборки для разных критериев (при H1, вероятности ошибок первого и

второго рода равны 0.05)

232

312 318

206 214223

0

50

100

150

200

250

300

350

Критерий Вальда Критерий Айвазяна Критерий Лордена

Ср

едн

ий

об

ъем

вы

бо

рки

СОВ, приближенные границы

СОВ точные границы

38

Пусть x1, x2, x3,… - последовательность независимых

наблюдений случайной величины ξ, подчиненной

нормальному закону распределения N(,).

Гипотезы о параметрах распределения ξ:

0 0

1 1 0

: , 0

: , 0

H

H

Параметр - неизвестен, альтернатива не фиксирована (1-неизвестна)

01t

Sn

Статистика критерия имеет вид:

Гипотеза H0 не отвергается, если 11

1

2nt F

где Fn-1 – функция распределения Стьюдента с (n-1) степенью свободы

У. Госсет

39

Гипотезы о параметрах распределения ξ:

00

01 1

: , 0

: : , 0

H

H

Параметр - неизвестен, альтернатива не фиксирована (1-неизвестна)

Статистика критерия имеет вид:

2 2

0 02 21 101

2002

10

1 1 1 1exp exp

2 2 2

1 1exp

2

n n

i ini in

nn

ini

x x dp

px d

40

Гипотезы Н0 принимается, если

1

0

1n

n

pA

p

Гипотезы Н1 принимается, если

1

0 1n

n

pB

p

Производятся дополнительные наблюдения до тех пор, пока выполняются неравенства

1

0

n

n

pB A

p

;

41

Вычисление оценок точных критических границ

0 : 0H 1 : 1.H

Таблица 1. Приближенные критические границы (B,A)

α β 0,01 0,05 0,1 0,15

0,1 0.01, 9.9 0.06, 9.5 0.11, 9 0.17, 8.5

0,15 0.01, 6.6 0.06, 6.33 0.12, 6 0.18, 5.66

Таблица 2. Оценки точных критических границ

α β 0,01 0,05 0,1 0,15

0,1 0.15, 5.44 0.32, 4.68 0.44, 4.14 0.52, 3.72

0,15 0.15, 3.65 0.32, 3.14 0.44, 2.77 0.53, 2.50

Вычисление оценок точных критических границ при

Есть зависимость от расстояния между гипотезами

Есть зависимость от ,

43

Проблемы при оценивании точных границ последовательного t-критерия

1 0.7H 1 0.75H 1 1H

1 2H 1 15H

Границы [B,A]

0.02, 6.18 0.15, 5.40 0.15, 5.44 0.65, 3.01 0.78, 1.65

0.5 0.6 0.7

Границы [B,A] 0.39, 4.95 0.25, 5.34 0.15, 5.44

Обзор последовательных критериев проверки гипотез

Алгоритм построения оценок точных критических границ методом Монте-Карло

Сравнение среднего объема выборки

Проверка сложных гипотез. Последовательный t-критерий Стьюдента

Группированные и цензурированные наблюдения

Применение последовательных критериев

44

План выступления

45

Использование последовательных критериев по случайно цензурированным наблюдениям

• Для всех наблюдений известно время начала наблюдения;Для всех наблюдений известно время начала наблюдения;• Для всех наблюдений известно время окончания наблюдения, Для всех наблюдений известно время окончания наблюдения, либо время выбытия из-под наблюдения;либо время выбытия из-под наблюдения;• Выбор выбывших наблюдений производится случайно.Выбор выбывших наблюдений производится случайно.

Введем обозначение:

тогда статистика критерия

или

46

1

1 0

( )

( )

ki

ki i

p x

p x

1

1 0

( )ln

( )

ki

k

i i

p x

p x

( ), x-не цензурированное наблюдение( )

{ } 1 ( ), x-цензурированное наблюдениеj

jj j

f xp x

P x F x

, j=0,1j=0,1..

Модификация критерия Вальда по случайно цензурированным наблюдениям

47

• Задачи приемочного контроля качества

Вальд А. Последовательный анализ. //М.: Физматгиз, 1960. - 325 с.

Page E.S. Continuous inspection schemes // Biometrika, 1954, v. 41, p. 100-114.

Актуальные области применения процедуры последовательной проверки гипотез о виде

распределения

• Задачи статистического управления технологическими операциями

Бендерский А.М. Статистическое регулирование технологических процессов методом кумулятивных сумм. – М.: Знание, 1973 – 70 c.

48

Актуальные области применения процедуры последовательной проверки гипотез о виде

распределения

• Задачи построения рациональных планов испытаний на надежность

Гродзенская И. С., Гродзенский С. Я., Томилин Н. А. Рационализация контроля надежности элементов и систем // Наукоемкие технологии, 2003, № 2, с. 85-87.

• Клинические испытания

Armitage P. Sequential medical trials. Oxford: Blackwell, 1961. 105 p.

49

• Радиолокационные задачи различения сигнала при наличии помех в системах, основанных на накоплении полезного сигнала

Гродзенская И. С. Разработка и исследование методов обнаружения радиосигналов при наличии помех на основе оптимальных статистических последовательных критериев // Тезисы докладов Научно-технической конференции студентов, аспирантов и молодых специалистов МИЭМ. – М.: МИЭМ, 2006, с. 257.

Актуальные области применения процедуры последовательной проверки гипотез о виде

распределения

1. Использование оценок точных критических границ дает ощутимый выигрыш в среднем числе наблюдений, особенно для модификаций критерия Вальда – критериев Айвазяна и Лордена.

2. В рассмотренном примере в случае использования приближенных критических границ несколько лучше работает критерий Айвазяна, однако при использовании оценок точных критических границ критерии Айвазяна и Лордена становятся практически эквивалентными.

3. Вычисление оценок точных критических границ требует определенных вычислительных затрат, а также разработки программного обеспечения, поэтому применять этот метод имеет смысл в случае проведения дорогостоящих, трудоемких и длительных экспериментов.

4. Нахождение оценок точных критических границ возможно и в более сложных случаях: при проверке сложных гипотез, при цензурировании и при группировании наблюдений.

50

Заключение

Recommended