Upload
tophisopam
View
20
Download
1
Embed Size (px)
Citation preview
Секвенирование генома за $1000
• Oxford Nanopore Technologies LTD
• Пока просеквенированы геномы бактериофагов, вирусов и бактерий
Парадокс
• Чем объяснить эту огромную разницу в размерах геномов?
Кузнечик Podisma pedestris
Плодовая мушка Drosophila melanogaster
18,000 Mb 180 Mb
Некодирующие участки геномаГены Геном
фаг MS2 4 3,5 kbHIV 19 9,7 kbE.coli 4’288 4,6 Mb
S.cerevisiae 6’275 12,1 MbM.musculus 23’786 2,7 GbH.sapiens 23’686(?) 3,2 Gb
P.aethiopicus ? 130 GbT.nigroviridis 27’918 340 Mb
P.dubium ? 670 GbP.japonica ? 150 GbC.ruddii 182 160 kbP.coffeae 6712 19,76 Mb
N.deltocephalinicola 137 112 kb
• Чем больше геном, тем больше места там занимают некодирующие участки
Сколько нужно генов?
• Itaya (1995) Нокаут 79 случайных генов Bacillus subtilis: только 6 летальны, 73 не влияют на жизнеспособность
• 7,5% генома незаменимы
• Геном B.subtilis 4,2x106 x7,5% = 3,2x105 bp
• Средний размер гена 1,25 кb, что дает минимальный размер генома ≈ 254 гена
Сколько нужно генов?
• Mushegian and Koonin (1996)
• Сравнение полных бактериальных геномовE. coli
H.influenzae M.genitalium
1,146
1,129
88918
10
239
1
Повторяющиеся элементы генома
• Рассеяные (диспергированные) повторы• Тандемные повторы• Микросателлиты• Минисателлиты• Сателлиты
Тандемные повторы
Класс Размер Блоки Локализация на хромосоме
Сателлиты 5-171 bp >100 kb ЦентромераМинисателлиты 6-64 bp 0,1-20 kb ТеломераМикросателлиты 1-13 bp < 150 bp Везде
Barbara McClintock (1902-1992)
• Открыла феномен транспозиции в 1930-х
• Получила Нобелевскую премию в 1983
Транспозоны
• Кодируют белок транспозазу
• Транспозаза вырезает транспозон и вставляет его в другое место
• На месте, где был транспозон, образуется повтор
Транспозон Tn3
• 39 bp инвертированные повторы на концах
4957 bp
устойчивость к ампициллину bla
транспозаза
tnpA“repressor” tnpR Tn3 resolvase
3 гена:
Чем еще опасны транспозоны?
• Передача устойчивости к антибиотикам• Перенос генов из хромосомы в плазмиду
• Перенос плазмид из одной клетки в другую• MDR
Ретротранспозоны
• LINE (Long Interspersed repeats)
• До 7 kb длиной; ~500’000 копий на геном
• Автономны• ~21% генома человека
• SINE (Short Interspersed repeats)
• 100-500 bp длиной; до 1 млн. копий
• Не могут перемещаться сами• 13% генома человека
• Произошли от 7SL-RNA, содержат промотор
Exon shuffling
exon 1 SINE
intron
exon 2
DNA copy of transcriptSINE exon 2
• Транскрипция SINE продолжается до нормального сигнала терминации
• Обратная транскрипция SINE и экзона
• Встраивание в случайном месте
Псевдогены
• Непроцессированные псевдогены: неполная дупликация или мутации в дуплицированной последовательности
• Процессированные псевдогены: обратная транскрипция и интеграция мРНК
Псевдогены
• Наибольшее число псевдогенов относится к рибосомным белкам
• По псевдогенам также можно отслеживать эволюцию
Мутации
• Репликация, репарация, рекомбинация, транспозиция...
• По современным оценкам, в популяции из 10 тысяч диплоидных организмов, каждый нуклеотид будет мутирован как минимум 20 раз в течение 1 миллиона лет
Сравнительная геномика. Филогения.
• Филогенетическое древо• Сравнение нуклеотидных последовательностей• Отбор мутаций:• Мутации в важных областях?• Мутации в малозначащих областях?• Мутации в кодирующих областях, не меняющие состав белка?
Филогенетика
• Попытка нарисовать «родословную» всех живых существ
• Понимание хода эволюции
• Уточнение биологической таксономии
... и животноводство!• Как происходило одомашнивание животных? Независимо или мигрирующие племена приводили их с собой?
• Сравнение филогенетических деревьев для одомашненных и диких свиней
• Оказалось, что свиней «приручали» независимо
Социальная организация насекомых
• Если проследить родственные связи между социальными насекомыми, то окажется, что социализация возникла независимо в трех группах
Last Unique Common Ancestor (LUCA)
• «Мифическое» существо, от которого произошло все живое на Земле
Молекулярные часы
• Скорость накопления мутаций примерно одинакова
• Таким образом, количество мутаций у потомства пропорционально числу поколений
• Однако кроссинговер может перемешать все карты. Как быть?!
Митохондриальная ДНК
• Мутирует крайне медленно, так как в мтДНК вообще нет ничего лишнего!
• Нет рекомбинации• Обычно для грубой оценки родства организмов используют рРНК и мтДНК
• ПРОБЛЕМА: передается только по материнской линии
Митохондриальная Ева
• Жила около 140-280 kya, предположительно в Восточной Африке
• Однако численность Homo sapiens sapiens, похоже, никогда не была менее 10’000 особей
• Сравнение с митохондриальной ДНК Homo neanderthalis: разошлись 660±140 kya
Есть ли польза от микросателлитов?
• Люди отличаются друг от друга количеством повторов микросателлитов
Есть ли вред от микросателлитов?
• FXMR - Fragile X-chromosome Mental Retardation
• Болезнь Хантингтона
Homo neanderthalis
• В 2010 году просеквенирован геном
• От 1 до 4% генов похожи на неандертальские, но только у тех, кто живет не в Африке
• То есть те, кто вышел из Африки, каким-то образом усвоили часть неандертальской ДНК
«Эффект основателя»
• Популяция африканеров произошла от небольшого числа поселенцев. Сейчас среди них высок процент страдающих болезнью Хантингтона.
• Генетическое разнообразие броненосцев в Северной Америке ниже, чем в Южной.
• У индейцев Америки не бывает группы крови В.
Bottleneck
• В небольших популяция очень высок шанс случиться дрейфу генов, что приводит к изменению распределения маркеров в популяции
B
B
b
B b
b
b
b b
b
b
b
B B
B
b
b
b
b b b
b
b
Гепарды в бутылочном горлышке
• По всей видимости, гепарды чуть не вымерли во время ледникового периода.
• Очень гомогенная популяция• Все «прелести» инбридинга: большая часть котят не доживает до года
Дрейф генов
• В популяции, состоящей из 10 самцов и 90 самок, генетическое разнообразие утрачивается с той же скоростью, что и в популяции, состоящей из 18 самцов и 18 самок.
• Львиные прайды
Наш ближайший родственник :)• Геном совпадает на 98,5%
• 24 пары хромосом
• Хромосомы 2А и 2В слились в районе теломеры, образовав человеческую хромосому №2, на которой легко обнаруживаются остатки теломер и центромер
• Около 30% белков идентичны
• В остальных - в среднем 2 замены аминокислот
• ~2,7% генома - дупликации и делеции (в популяции человека ~0,5%)
• Разошлись в эволюции около 6 млн. лет назад
Человек и шимпанзе
• У человека мутирована каспаза-12, которая мешает развитию Альцгеймера у обезьян
• Наибольшие отличия - в факторах транскрипции, например FOXP2, мутации в котором приводят к нарушениям речи и распознанию языков
• Данные по сравнению Х-хромосом указывают на то, что они разошлись на 1,2 млн. лет позже, чем остальные хромосомы (?!)
• Есть существенные отличия в некодирующих RNA, некоторые из которых специфичны для большого неокортекса, которого нет у обезьян
Horizontal (Lateral) Gene Transfer
• Перенос генов между разными организмами• Один из таких примеров - бактериальная кобламинсинтетаза, находится в месте стыка хромосом 2A и 2B.
Дупликация участков генома
• Дрожжи: спонтанное удвоение небольших участков генома (50-250 тысяч пар оснований)
• Возникают в результате ошибок репликации или неправильного залечивания двуцепочечных разрывов
• После расхождения человека и шимпанзе, наши предки получали в результате удвоения ~5 пар оснований каждый год
• Средний размер удваиваемого участка ~50 тыс. пар оснований
Что происходит с удвоенным геном?
• В отсутствие эволюционного давления, вторая копия начинает накапливать мутации и инактивируется
• У человека обнаружено множество примеров, когда вторая копия гена сильно мутирована и неактивна
• Иногда второй ген начинает мутировать и приобретать новые свойства
Гомология и все-все-все
• Гомологи: очень похожие ДНК/РНК/белки
• Ортологи: гомологи из двух разных организмов
• Аналоги: белки/органы/ткани, выполняющие одни и те же функции, но не имеющие общего предшественника
• Паралоги: гены, возникшие в результате удвоения, но затем разошедшиеся в ходе эволюции (гемоглобины А, A2, B, F)
Сложная гомология• Гомология может проявляться на уровне первичных, вторичных и третичных структур
• Ангиогенин vs. pancreatic RNaseCLUSTAL 2.1 MULTIPLE SEQUENCE ALIGNMENT
File: /Users/my/Desktop/ang.ps Date: Sat Mar 31 15:27:09 2012 Page 1 of 1
: :**::::* ** . *:*.:: ** .:* ** *:... . .. **:.:****.:*. ** :***:* .:: :* :: . : : * *:**:::* *:* .** :* * **::. *:::****.. :***:*gi|178250|gb|AAA51678.1| ----MVMGLGVLLLVFVLGLGLTPPTLAQDNSRYTHFLTQHYDAKPQ-GRDDRYCESIMRRRGLTS-PCKDINTFIHGNKRSIKAICENK--NGNPHRENLRISKSSFQVTTCKLHGGSPWPPCQYRATAGFRNVVVACENG--LPVHLD 140gi|38201686|ref|NP_937878.1| MALEKSLVRLLLLVLILLVLGWVQPSLGKE-SRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGRCKPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVHFD 149 1.......10........20........30........40........50........60........70........80........90.......100.......110.......120.......130.......140.......150
*: .gi|178250|gb|AAA51678.1| QSIFRRP 147gi|38201686|ref|NP_937878.1| ASVEDST 156 .......
β-талассемия
• NMD
• Non-sence mediated decay
• Уничтожает неправильно сплайсированные мРНК
• Плохо справляется с ошибками в последнем экзоне