33
Институт общей генетики им. Н.И. Вавилова РАН Статистика множественных сравнений в ассоциативных исследованиях полиморфизма ДНК: Кошмар Бонферрони Рубанович А.В.

Институт общей генетики им. Н.И. Вавилова РАН

  • Upload
    cicely

  • View
    88

  • Download
    1

Embed Size (px)

DESCRIPTION

Статистика множественных сравнений в ассоциативных исследованиях полиморфизма ДНК :. Кошмар Бонферрони. Рубанович А.В. Институт общей генетики им. Н.И. Вавилова РАН. 1000 человек угадывали последовательность из 10 карт: красная или черная?. - PowerPoint PPT Presentation

Citation preview

Page 1: Институт общей генетики им. Н.И. Вавилова РАН

Институт общей генетики им. Н.И. Вавилова РАН

Статистика множественных сравнений в ассоциативных исследованиях полиморфизма

ДНК:

Кошмар Бонферрони

Рубанович А.В.

Page 2: Институт общей генетики им. Н.И. Вавилова РАН

Опыты по выявлению людей с паранормальными способностями:

Joseph Rhine (1950)

1000 человек угадывали последовательность из 10 карт: красная или черная?

12 человек угадали 9 из 10 карт, двое все 10 карт

Вывод Д. Райна: «нельзя сообщать подопытным людям об их паранормальных способностях»

Все выявленные «экстрасенсы» в последующих опытах не подтвердили свои способности

Page 3: Институт общей генетики им. Н.И. Вавилова РАН

Что произошло?

Шансы найти «экстрасенса» среди 100 человек =

1- Р(100 раз не найти)

Шансы найти «экстрасенса» среди 1000 человек =

Page 4: Институт общей генетики им. Н.И. Вавилова РАН

Точный тест Фишера с помощью монеты

Облучение:9 дицентриков на 1000 клеток

Контроль:1 дицентрик на 1000 клеток против

Case:9 мутаций на 100 больных

Control:1 мутация на 100 здоровых

против

Значимость различий 9 против 1 равна

вероятности выпадения 9 или 10 «орлов»

в 10 бросаниях монеты

Если объемы выборок равны, значимость различий зависит только от числа событий

(числа мутаций в выборках) …и не зависит от самих объемов выборок!!!

Эти различия значимы(в единичном тесте ),

но при проведении 100 тестов вероятность появления

фальшивых отличий равна

Page 5: Институт общей генетики им. Н.И. Вавилова РАН

Почему в середине 90-ых заговорили о проблеме «multiple comparisons» ?

В ассоциативных исследованиях полиморфизма ДНК, как правило, фигурируют 3-5 (или 5-20) полиморфных локусов (это число еще нужно умножить на число заболеваний или сравниваемых признаков)

Genome-wide association: изучение экспрессии генов при помощи микрочипов – 500 000 SNP. При уровне значимости 0.01 можно ожидать 5000 ложных ассоциаций

Мета-исследования (исследования исследований): как объединять и сравнивать данные, полученные разными авторами

Проведение большого количества тестов (множественных сравнений)

связано с опасностью фальшивых открытий

Page 6: Институт общей генетики им. Н.И. Вавилова РАН

Генерируем две одинаково распределенные выборки по 100 особей с 20-локусными генотипами

gencase gencontrol ORreal p1 6 7 0.85 0.7822 12 9 1.4 0.5133 8 7 1.2 0.7964 9 9 1.0 1.005 9 9 1.0 1.006 9 11 0.80 0.6557 10 10 1.0 1.008 8 11 0.70 0.4919 8 9 0.88 0.80810 7 14 0.46 0.12711 12 9 1.4 0.51312 8 10 0.78 0.63713 12 10 1.2 0.67014 10 10 1.0 1.0015 7 6 1.2 0.78216 12 11 1.1 0.83517 10 9 1.1 0.81918 11 9 1.2 0.65519 13 10 1.3 0.53220 7 5 1.4 0.564

gencase gencontrol ORreal p1 14 7 2.2 0.1272 12 5 2.6 0.08963 15 14 1.1 0.8534 8 12 0.64 0.3715 5 8 0.61 0.4056 9 10 0.89 0.8197 7 6 1.2 0.7828 10 12 0.81 0.6709 12 9 1.4 0.51310 10 12 0.81 0.67011 12 12 1.0 1.0012 14 9 1.6 0.29713 15 7 2.3 0.088114 7 9 0.76 0.61715 6 6 1.0 1.0016 9 10 0.89 0.81917 11 7 1.6 0.34618 8 7 1.2 0.79619 15 13 1.2 0.70520 11 6 1.9 0.225

gencase gencontrol ORreal p1 10 9 1.1 0.8192 12 10 1.2 0.6703 12 13 0.91 0.8414 10 16 0.58 0.2395 11 13 0.83 0.6836 13 13 1.0 1.007 12 4 3.3 0.04558 12 8 1.6 0.3719 13 12 1.1 0.84110 14 11 1.3 0.54911 17 10 1.8 0.17812 9 5 1.9 0.28513 8 9 0.88 0.80814 15 9 1.8 0.22115 11 9 1.2 0.65516 9 16 0.52 0.16217 10 14 0.68 0.41418 11 10 1.1 0.82719 10 10 1.0 1.0020 11 6 1.9 0.225

gencase gencontrol ORreal p1 7 8 0.87 0.7962 10 2 5.4 0.02093 17 5 3.9 0.01054 13 12 1.1 0.8415 12 11 1.1 0.8356 7 10 0.68 0.4677 10 12 0.81 0.6708 14 9 1.6 0.2979 14 8 1.9 0.20110 9 12 0.73 0.51311 13 9 1.5 0.39412 9 14 0.61 0.29713 10 13 0.74 0.53214 8 8 1.0 1.0015 14 12 1.2 0.69516 17 7 2.7 0.041217 11 13 0.83 0.68318 10 8 1.3 0.63719 16 10 1.7 0.23920 12 8 1.6 0.371

Как это бывает? Наблюдаем появление фальшивых ассоциаций

OR p Ген Выборка 1 Выборка 2Больные Здоровые

Odd Ratio – отношение шансов,популярная мера сопряженности.

При отсутствии связи OR=1

1

Должно бытьOR=1

Значимо!

234Сразу 3 локуса

«ассоциированы» с заболеваемостью!

Частоты минорых аллелей (в среднем 0.1)

Page 7: Институт общей генетики им. Н.И. Вавилова РАН

Как же избежать фальшивых открытий?

При проведении m независимых статистических тестов на уровне

значимости , вероятность хотя бы одного фальшивого результатадолжна быть

1-(1-)m < 0.05

Правило Карло Бонферрони (1935):При проведение m независимых статистических тестов

значимы только те результаты, для которых

Page 8: Институт общей генетики им. Н.И. Вавилова РАН

Правило Бонферрони ликвидирует значимость вполне определенных результатов:

Контроль (100)

Больные (100)

OR p

Мутация 1 1 7 7,45 0,0349

Мутация 2 5 15 3,6 0,0253

Однако правило Бонферрони требует:p < 0,05/2=0,025

Две мутации, ассоциированные с заболеванием

1 против 7 при равных по объему выборках:

Page 9: Институт общей генетики им. Н.И. Вавилова РАН

Правило Бонферрони ликвидирует значимость вполне определенных результатов:

Контроль (100)

Больные (100)

OR p

Мутация 1 1 7 7,45 0,0349

Правило Бонферрони требует:p < 0,05/2=0,025

Одна мутация + любой, не относящийся к делу признак

Фамилия начинается с гласной

буквы

36 40 1,19 0,646

Увы, это не шутка!!!

Page 10: Институт общей генетики им. Н.И. Вавилова РАН

Assessment of individual sensitivity to ionizing radiation and DNA repair efficiency in a healthy population

F. Marcona, C. Andreoli, et al. Mut. Res., 541 (2003)

Незначимо! Поправка Бонферрони требует:

Генотипы

Page 11: Институт общей генетики им. Н.И. Вавилова РАН

High-Throughput Detection of GST Polymorphic Alleles in a Pediatric Cancer Population P. Barnette, R. Scholl, et al. Cancer Epidemiology, Biomarkers & PreventionVol. 13, 304–313, 2004

8 видов заболеваний

13 генотиповOR=6,4 P=0,007

OR=2,3 P=0,018

Незначимо! Поправка Бонферрони требует:

Гомозиготность по делециям GST защищает от рака!

Контроль

Page 12: Институт общей генетики им. Н.И. Вавилова РАН

Implication of Xenobiotic Metabolizing Enzyme gene (CYP2E1, CYP2C19, CYP2D6, mEH and NAT2) Polymorphisms in Breast Carcinoma

A. Khedhaier, E. Hassen, et. al. BMC Cancer, 2008

Все стройно, но Бонферрони требует:

microsomal Epoxide Hydrolase:Минорный аллель (С)

обуславливает пониженную активность ферментаУ больных 12%

гомозигот СС против 6% в контроле

При этом среднее время выживания гомозигот СС выше, чем у больных с

другими генотипами (повышенная эффективность химиотерапии?)

Page 13: Институт общей генетики им. Н.И. Вавилова РАН

Bonferroni method creates more problems than it solves Аргументы Томаса Пернежера (Thomas Perneger, 1998):

Интерпретация данных зависит от числа тестов. Это противно нашей интуиции. Данные не могут терять значимость от того, что их кто-то подтвердил!

При большом количестве тестов гипотеза о том, что все наблюдаемые различия неслучайны, никому не нужна

При коррекции Бонферрони вероятность упустить существенные различия столь велика, что

…лучше просто перечислить какие тесты дали значимые результаты и, главное, почему

“Bonferroni adjustments are, at best, unnecessary and, at worst, deleterious to sound statistical inference…”

Page 14: Институт общей генетики им. Н.И. Вавилова РАН

…мы не будем гробить свои результаты из-за какого-то там Бонферрони

…спрашивать диссертанта о Бонферрони – это дурной тон

…«бонферронофобия» набирает обороты

…разработчики программ не желают вводить кнопочку «Bonferroni»

…хуже Бонферрони ничего нет, не считая отсутствия всякой коррекции

Из разговоров на форуме molbiol.ru:

Page 15: Институт общей генетики им. Н.И. Вавилова РАН

Чуть-чуть об ошибках статистических тестов

Ошибка I рода () Вероятность отвергнуть правильную нулевую гипотезу = Вероятность обнаружить различия там, где их нет = Вероятность совершить фальшивое открытие

Ошибка II рода ()Вероятность принять неправильную нулевую гипотезу = Вероятность не обнаружить существующие различия = Вероятность упустить открытие

Мощность теста = 1- Ошибка II рода = Вероятность правильно отвергнуть нулевую гипотезуВероятность не упустить открытие

Нулевая гипотеза – обычно предположение об отсутствии различий = 2 выборки из одной генеральной совокупности

Традиционно биолог ориентирован на контроль ошибки I рода (через уровень значимости),

т.е. на гарантии отсутствия ложных открытий,

… и при этом мало заботится о возможности упустить открытие (ошибка II рода)

Page 16: Институт общей генетики им. Н.И. Вавилова РАН

Мощность статистических тестов

Мощность 80% считается приемлемой (мощность обычных тестов в реальных ситуациях)

Консервативный тест - это тест с низкой мощностью (напр., критерий Колмогорова-Смирнова) Метод Бонферрони – архиконсервативен (особенно при сравнении частот)

Во многих случаях коррекция Бонферрони делает выявление значимых результатов попросту невозможным

Page 17: Институт общей генетики им. Н.И. Вавилова РАН

От чего зависят ошибки статистических тестов?

От размаха реально существующих отличий и разброса данных

От объемов выборок

Ошибки I и II рода однозначно не связаны. В целом ошибка II рода растет при уменьшении ошибки I рода (главная причина маломощности метода Бонферрони )

С увеличением объема выборки мощность теста (вероятность не упустить открытие)

всегда возрастает

Крайний случай: «критерий» св. Фомы Неверующего (0033) Ошибка I рода = 0 Ошибка II рода = 1

Ошибка I рода (вероятность фальшивого открытия) слабо зависит от объемов выборок,если они сравнимы по величине

Page 18: Институт общей генетики им. Н.И. Вавилова РАН

0

0,2

0,4

0,6

0,8

0 5 10 15 20Число тестов

Ош

ибк

а II

род

а

Зависимость ошибки II рода от числа тестов при использовании поправки Бонферрони

Вероятность пропустить ген с OR=2.7 на выборках 100 (case) и 100 (control)

При 100 сравнениях ради того, чтобы гарантировать отсутствие хотя бы одного

ложного результата, мы упускаем 88% открытий!

При m=100 ошибка равна 0.88

1

В отдельном тесте вероятность упустить открытие равна 0.2

При 5 сравнениях упускаем 50% открытий

Page 19: Институт общей генетики им. Н.И. Вавилова РАН

Новый принцип проверки статистических гипотез: FDR-контроль

False Discovery Rate control: Benjamini, Hochberg (1995)

Вероятность фальшивого открытия < Уровня значимости Ошибка I рода < 0.05

Средняя доля фальшивых открытий < Выбранный уровень

Традиционный принцип заменяется на 105 статей в базе

Page 20: Институт общей генетики им. Н.И. Вавилова РАН

Алгоритм контроля FDR (Benjamini(Benjamini,, Hochberg, 1995) Hochberg, 1995)

Упорядочиваем тесты по уровню Упорядочиваем тесты по уровню p-p-величин: величин:

pp11 p p22 … … p pmm..

Для контроля Для контроля FDR FDR на уровне на уровне αα (например 0.05) (например 0.05),,

находимнаходим

Считаем различия значимыми при Считаем различия значимыми при j = 1, …, j*.j = 1, …, j*.

ПриПри j > jj > j* * различия считаются незначимыми

m

jpjj j:max*

Порядковый номер генаЖелательный

уровень значимости

Общее число тестов (генов)

Величина p для j-ого теста (гена)

Page 21: Институт общей генетики им. Н.И. Вавилова РАН

Коррекция Bonferroni

0,005

0,005

0,005

0,005

0,005

0,005

0,005

0,005

0,005

0,005

Пример: множественные сравнения по 10 тестам

Коррекция по FDR

0,005

0,010

0,015

0,020

0,025

0,030

0,035

0,040

0,045

0,050

Тест pi

1 0,001

2 0,0055

3 0,01

4 0,015

5 0,02

6 0,04

7 0,3

8 0,5

9 0,6

10 0,8

Значимые различия без поправок на

множественность

Располагаем тесты в порядке увелечения p

Поправка Бонферрони оставляет значимым лишь

первое сравнение

В первой клеткекак у Бонферрони,во второй клетке

вдвое больше,втрое большеи т.д ….

Для 6-ого теста p больше этого значения

Значимые различия после

коррекции по FDR

И это все!!!

Page 22: Институт общей генетики им. Н.И. Вавилова РАН

То же самое в общем случае:m – число сравнений, =0.05 (например)

Bonferroni (1939) FDR (1995)

p1 /m /m

p2 /m 2/m

p3 /m 3/m

… /m …

pi /m i/m

… /m …

pm /m

Бонферрони торжествует!Контроль FDR приносит ощутимые результаты,

если хотя бы один тест удовлетворяет правилу p < /m

<

Page 23: Институт общей генетики им. Н.И. Вавилова РАН

ПримерПример: : экспрессия 3051 генов при острой лейкемииэкспрессия 3051 генов при острой лейкемииGolub T.R. Molecular classification of cancer: class discovery and class Golub T.R. Molecular classification of cancer: class discovery and class

prediction by gene expression monitoring.prediction by gene expression monitoring. // Science. 2001, v.286.// Science. 2001, v.286.

t-t-тесттест: 1045 : 1045 генов,генов, для которыхдля которых p<0.05 p<0.05 Коррекция БонферрониКоррекция Бонферрони : 98 : 98 геновгенов длядля p’<0.000016 p’<0.000016 FDR: 681 FDR: 681 генов, для которыхгенов, для которых FDR< 0.05 FDR< 0.05

t-статистика при сравнении экспрессии гена у больных

и здоровых

Число генов с данным уровнем t-статистики

Page 24: Институт общей генетики им. Н.И. Вавилова РАН

Permutation tests: случайные перестановки пометок «case-control»

в компьютерных симуляциях по алгоритму:

Что делать, еслиЧто делать, если FDR FDR не помогает? не помогает?

В исходной базе данных делаем случайную перестановку В исходной базе данных делаем случайную перестановку

лейблов лейблов case-control

Вычисляем зановоВычисляем заново pp--уровни для каждого гена (уровни для каждого гена (ppperm))

Повторяем процедуру Повторяем процедуру N разраз (минимум 10000), фиксируя (минимум 10000), фиксируя

случаи, когда случаи, когда ppperm меньше исходного значения меньше исходного значения pp Вычисляем откорректированное Вычисляем откорректированное pp как

N

ppp perm

случаев Число

'

Тем самым мы отказываемся от попыток вычислить значимость различий.

Вместо этого мы ее «измеряем» экспериментально, разыгрывая ситуацию на компьютере

Точный тест Фишера – это тоже permutation test, только реализованный аналитически (р вычисляетсяпо формулам комбинаторной теории вероятностей)

Page 25: Институт общей генетики им. Н.И. Вавилова РАН

SNPЧастота минорного

аллеля OR pCase (100) Control (100)

1 62 26 4,6 0,0001

2 19 6 3,7 0,009

3 31 14 2,8 0,011

4 20 8 2,9 0,023

5 11 4 3,0 0,071

6 23 13 2,0 0,096

7 44 30 1,8 0,103

8 54 39 1,8 0,120

9 59 53 1,3 0,571

10 40 41 1,0 0,911

Значимо без коррекции на

множественность

p`

0,000

0,010

0,007

0,025

0,109

0,098

0,058

0,067

0,476

1,000

Permutation test применительно к данным об ассоциации заболеваемости с 10 SNP

Переставляем отметки «case-control» 10000 раз. В результате получаем коррекцию p

Значимо по Бонферрони

Значимо по FDR

Indulgentia Но так бывает не всегда

Page 26: Институт общей генетики им. Н.И. Вавилова РАН

Почему Почему Permutation test так либерален?

Поправки Бонферрони и Поправки Бонферрони и FDR FDR предполагают, что все тесты предполагают, что все тесты независимы независимы

Перестановка лейблов «Перестановка лейблов «case-controlcase-control»» сохраняет сохраняет корреляционные связи между данными корреляционные связи между данными (в случае полиморфных генов можно сказать: «учитывает (в случае полиморфных генов можно сказать: «учитывает неравновесие по сцеплению»)неравновесие по сцеплению»)

Учитывает совместные распределения тестовых Учитывает совместные распределения тестовых статистикстатистик

В результате В результате Permutation test значительно менее консервативен, чем Bonferroni ии FDR

Page 27: Институт общей генетики им. Н.И. Вавилова РАН

Не предусмотрен в стандартных статпакетах.Не предусмотрен в стандартных статпакетах.На сегодняшний день доступно:

Как реализовать permutation tests?

free 30-day demo version https://www.dynacom.co.jp/e/products/package/snpalyze

FREE!!! http://statgen.ncsu.edu/powermarker/index.html

Free software environment for statistical computing: встроенные функции + HaploStats, SNPassoc и многое др.

http://www.r-project.org/index.htmlhttp://www.r-project.org/index.html

И все же всегда проще самому!

simNum 10000;

sumDif Table0,LengthfrCase;Dol RandomPermutation2volSample;tot Joinill, health;ill totTakel, volSample;health totTakel, volSample;genCase1 one.ill;

genControl1 one.health;

xiSqgenCase1 genControl12genCase1 genControl1N;p1 1 CDFChiSquareDistribution1, xiSq;sumDif sumDif UnitStepp p1,simNum;

simp sumDifsimNumN;

Page 28: Институт общей генетики им. Н.И. Вавилова РАН

Борьба с кошмаром Бонферрони продолжается!Борьба с кошмаром Бонферрони продолжается!

Нейронные сети, случайные деревья, Нейронные сети, случайные деревья, генетические алгоритмы, гибсовские полягенетические алгоритмы, гибсовские поля и еще Бог знает чтои еще Бог знает что

Переход от генотипов к гаплотипам:Переход от генотипов к гаплотипам: реальное уменьшение числа сравнений. реальное уменьшение числа сравнений. Информация о межлокусных корреляциях сохраняется!Информация о межлокусных корреляциях сохраняется!

Если число локусов Если число локусов ≥3≥3, то обычно , то обычно ччисло наблюдаемых гаплотипов исло наблюдаемых гаплотипов << << числа генотиповчисла генотипов

Типичная ситуация для 3 локусов:27 возможных генотипов, но лишь

5-7 гаплотипов встречаются с частотой >1%

Page 29: Институт общей генетики им. Н.И. Вавилова РАН

http://www.bios.unc.edu/~lin/hapstat/

X. Sole, E. Guino, J. Valls, R. Iniesta1, V. Moreno (2006) http://bioinfo.iconcologia.net/index.php?module=Snpstats

Soft для работы с гаплотипами

Page 30: Институт общей генетики им. Н.И. Вавилова РАН

SNPStats

Однолокусный анализ Allele and genotype frequencies Test for Hardy-Weinberg equilibrium Analysis of association with a response variable based on linear or logistic regression Multiple inheritance models: co-dominant, dominant, recessive, over-dominant and additive Analysis of interactions (gene-gene or gene-environment)

Многолокусный анализ Linkage disequilibrium statistics Haplotype frequency estimation Analysis of association of haplotypes with the response Analysis of interactions (haplotypes-covariate)

Page 31: Институт общей генетики им. Н.И. Вавилова РАН

Haplotype association with response (n=164, crude analysis)

  COMT GSTP1 MTHFR Freq OR (95% CI) P-value    

1 L A C 0.2719 1 ---    

2 H A C 0.1996 2.69 (1.02 - 7.12) 0.048    

3 H G C 0.1155 0.10 (0.01 - 1.26) 0.076    

4 L G C 0.1059 3.22 (0.95 - 10.93) 0.062    

5 H A T 0.099 2.08 (0.77 - 5.60) 0.15    

6 L G T 0.0906 1.50 (0.49 - 4.62) 0.48    

7 L A T 0.0773 3.24 (0.67 - 15.68) 0.15    

8 H G T 0.0402 13.88 (1.21 - 158.65) 0.036    

Global haplotype association p-value: 0.033

По отдельности локусы не обнаруживают значимых ассоциаций!

SNPstats SNPstats в действии: ассоциации миом с 3 в действии: ассоциации миом с 3 SNPSNP ((данные Т.И. Ивановой и Л.Е. Сальниковой, май 2008)данные Т.И. Ивановой и Л.Е. Сальниковой, май 2008)

Page 32: Институт общей генетики им. Н.И. Вавилова РАН

Чтобы не уподобиться старому Джозефу

Чтобы преодолеть соблазн раздувать отчет о проделанной работе

Чтобы предупредить выпады недоброжелателей

Это просто и делается вручную. Если хотя бы одно сравнение проходит через сито Бонферрони, то с Вас хватит FDR. В противном случае Вам не обойтись без перестановочного компьютерного теста.

Почему не следует пренебрегать коррекцией на множественность сравнений?

Page 33: Институт общей генетики им. Н.И. Вавилова РАН

Спасибо

Оргкомитету школы

и Всем присутствующим !!!

С удовольствием предоставлю копию презентации заинтересованными коллегам

[email protected]