Metagenom Analiz Stratejilerimikrobiyota2016.ftskongre.org/webkontrol/uploads/files... ·...

Preview:

Citation preview

Metagenom Analiz Stratejileri

Prof.Dr. Engin YılmazAcıbadem Üniversitesi

Tıbbi Biyoloji AD

1. Ulusal İnsan Mikrobiyotası veSağlığımıza Etkileri Kongresi

8-10 Aralık 2016, Ankara

İnsan Genom Projesiİnsan genomunu ve onun insan sağlığı üzerinde oynadığı rolü anlamaya çalışmak.

1990

2000

2003

2006

2008

2005

2003/2007

İnsan Mikrobiyom Projesiİnsan vücudunun farklı bölgelerinde bulunan mikroorganizmagruplarını karakterize etmek, mikrobiyom ve insan sağlığındaki değişiklikler arasındaki ilişkiyi anlamak.

Our second genome

2008

• İnsan vücudu içinde ve üzerinde ~ 100 trilyon bakteri bulunmaktave vücut ağırlığının ~ % 3'ünü oluşturmaktadır.

• Rolleri konusunda sınırlı bir bilgiye sahip olsak da, bu çeşitliliği sağlık ve hastalıkta sorgulayabilen teknolojilere sahibiz.

• Sağlıklı bireylerin normal florası, yeni modülatörler ve doğal ürünlerin tanımlanması için bir kaynak oluşturmaktadır.

• Popülasyondaki değişiklikler ve kaymalar, sağlık durumunun göstergeleri olarak kullanılabilir.

• Mikrobiyom, hastalığın seyrinin izlenmesi için kullanılabilir.

İnsan Mikrobiyom ProjesiPotansiyel Etkisi

• Mikrobiyom bağışıklık gelişiminde önemli rol oynamaktadır.

• Mikrobiyota / antibiyotik ve immün aracılı hastalıkların gelişimi

arasındaki ilişkiler belirlendi.

• Gelişmiş sanitizasyon, antibiyotik kullanımı ve bağışıklama,

mikrobiyotayı değiştirebilen faktörlerdir.

• Mikrobiyal populasyonlar coğrafi bölgeye göre değişebilir.

• Mikrobiyom akıl sağlığı ve insan davranışını etkileyebilir.

– Ağırlık / BMI‘e bağlı olarak mikrobiyomda farklılıklargözlenebilir.

– Diyete bağlı olarak mikrobiyomda farklılıklar gözlenebilir.

– Sağlık durumuna bağlı olarak mikrobiyomda farklılıklargözlenebilir.

İnsan Mikrobiyom ProjesiPotansiyel Etkisi

metabolizma

Mikrobiyomun insandaki rolünü anlamak için hangi biyolojik özelliklere ihtiyacımız var?

transkriptler?proteinler?metabolitler?

Metagenom: mikrobiyomun genetik taslağı

Metagenom Analiz Stratejisi

16s rRNA amplikon dizilimi ile kimlerin olduğu belirlenir?

2,3 milyonun üzerinde bilinen bakteri 16s rRNA'sı

Tür ve miktarının belirlenmesi

Metagenomik dizilim - ne yapabilirler?

Pan-genom içeriğinin belirlenmesi

Metagenomik transkriptomikler - aktif genler?

RNA’nın cDNA’ya cevrilmesi ve dizilenmesi

Aktif olarak transkribe olan bakteriyel genlerin belirlenmesi

için insan dizilerinin ve bakteriyel rRNA‘nın filtrelenmesi

Diğer “omics” teknolojileri: Proteomics, transcriptomics, metabolomics

Biyolojik yorumlamayı yapabilmek için terabayt düzeyindeki datanın analizi

Kültüre bağlı analiz:

• Organizmanın laboratuvarda üretilmesi ve saf kolonilerin sağlanması.

• Genom dizisinin tamamlanması.

Kültüre bağlı olmayan analiz:

• 16S ribosomal RNA (rRNA) dizilemesi.

• Son yıllardaki teknolojik gelişmeler sayesinde, tüm genomun fragmanlar

halinde dizilenmesi, biraraya getirilmesi ve referans genomlar ile

karşılaştırılması mümkün olmaktadır.

• Biyoinformatik analiz metodları ve modellerinin geliştirilmesi ile büyük

data setlerinin analizedilmesi.

• Elde edilen veriler diğer “omics” teknolojileri ile birlikte

değerlendirilerek daha fazla bilgiye sahip olabilmek.

Metagenom Analiz Stratejisi

16S rRNA Gen Analizi

Korunmuş bölgelerTüm bakterilerde aynı

Tek PCR primer çifti, çeşitli bakterilerden gelen 16S

rRNA genlerini çoğaltabilir

Değişken bölgelerTürler arasında korunmuşTürler arasında farklılık

Bakteri "türlerinin" çeşitlerini ve bolluklarını tanımlamak için diziden "bilgi" çıkarma.

Bakteri türleriBelirlenen türlerin zenginliğinin belirlenmesiTürler arası ilişkilerin belirlenmesi

Popülasyon çeşitliliğinin analizi.

Popülasyonlar arasındaki çeşitliliğin karşılaştırılması.

Tür Zenginliği ve Doğruluğunun Tahmini

• 16S rRNA geni kütüphane analizi

Genom kapsama alanı kütüphanedeki bolluk ile orantılıdır

yoğun türler > orta yoğunluktaki türler > nadir türler

16S rRNA Veri Analizi

QIIME (Quantitative Insights Into Microbial Ecology)

http://qiime.sourceforge.net

mothur http://www.mothur.org

MG-RAST (Metagenomics - Rapid Annotation using Subsystems Technology)

http://metagenomics.nmpdr.org

Genboree http://genboree.org/java-bin/workbench.jsp

EzTaxon http://eztaxon-e.ezbiocloud.net

Pheonix2 http://sourceforge.net/projects/phoenix2.

METAGENassist http://www.metagenassist.ca.

MEGAN http://www-ab.informatik.uni-tuebingen.de/software/megan

VAMPS http://vamps.mbl.edu

CloVR-16S http://clovr.org/developers

RDPipeline (Ribosomal Database Project Pipeline) http://rdp.cme.msu.edu

Plummer et al., J Proteomics Bioinform 2015, 8:12

Neden Metagenom Gerekli?

Hücre yapısının veişlevinin araştırılması

Metabolizmanınanlaşılması

Genomun yenidendüzenlenmesi

İlaç ve aşıgeliştirilmesi Protein protein

ilişkilerininanlaşılması

Minimal gen setinintanımlanması

DNA varyasyonlarınıntanımlanması

Genotipleme ve Adlitıp

Gen ifadesinin anlaşılması(RNA-Protein)

Konakcı ile ilişkininanlaşılması

Dizileme Yöntemleri

Sentez ile dizileme

Sanger sequencing (Applied Biosystems)

Pyrosequencing (Roche/454)

Reversible terminator (Illumina)

Ion torrent (Life Technologies)

Single Molecule Real Time Sequencing (Pacific Biosciences)

Oligo ligasyon ile dizileme

SOLiD (Applied Biosystems)

DNA dizisinin direk okunması

Nanopore sequencing (Oxford Nanopore Thec.)

Yeni Nesil Oyuncaklar

PacBio RS II: long-read sequencer

Sequel System: SMRT Sequencing

DNA dizi analiz metodlarının karşılaştırılması

Metod Okuma UzunluğuDoğruluk %(tek okuma)

Okuma/Koşum Zaman/Koşum Fiyat/milyon baz Avantaj Dezavantaj

Gerçek zamanlıdizileme(PacBio)

avg 14,000 bpmax >40,000 bp

8750,000/ SMRT cell, 500–1000

mbaz

30 dk4 saat

$0.13–$0.60En uzun okuma

uzunluğuHızlı tanımlama

Orta ölcekliEkipman çokpahalı olabilir

Düşük doğruluk

Yarı iletken iyon(Ion Torrent)

>400 bp 98 >80 milyon 2 saat $1Daha ucuz

ekipman HızHomopolimer

hatası

Pyrosequencing (454)

700 bp 99.9 1 milyon 24 saat $10Uzun okuma

boyuHız

Koşumlar pahalıHomopolimer

hatası

Sentez iledizileme

(Illumina)50 - 300 bp 99.9

>6 milyar(TruSeq )

1 - 11 günCihaza ve okumauzunluğuna bağlı

$0.05 - $0.15

Sıralama modülüne ve

istenen uygulamaya bağlı olarak yüksek dizi

verimipotansiyeli

Ekipman çokpahalı olabilirYüksek DNA

konsantrasyonugerekli

Ligasyon iledizileme

(ABI SOLiD) 50+35 / 50+50 bp 99.9 1.2 - 1.4 milyar 1 - 2 hafta $0.13

Baz başına düşükmaliyet

Diğermetodlardandaha yavaşPalindromik

dizilerin sekansıkonusu?

Zincirterminasyonu

(Sanger)400 - 900 bp 99.9 N/A 20 dk - 3 saat $2400

Uzun bireyselokuma

Birçok uygulama için kullanışlı

Büyük dizileme projeleri için

pahalı ve pratik değil

Klonlama veyaPCR zaman alıcı

basamak

Yüksek Ölçekli Veri Analizi

Data Analizi

Sorgulama, karşılaştırma,veri kümelerini analiz etme

Metadata bağlamında sekans verilerini analiz etmek için çokdeğişkenli istatistikler

Örnek Karşılaştırma- Taksonomik profiller- Fonksiyonel ve

metabolik profiller

Noncoding özelliklerinbelirlenmesi

(16S, 18S, tRNA)Protein işlevi

Bir araya getirme- Metagenomik- Metatranskriptomik- Kısa Peptidler

Taksonomik Sınıflandırma

Referans genom ve karşılaştırmalıgenom değerlendirmesi içinokumanın planlanması

Metagenomik Verilerin Analiz Şeması

Bioinformatics and Biology Insights 2015:9 75–88

Çalışmanın tasarımı, grupların oluşturulması ve

örneklemin sayısı

Metaveri standartlarıve gizlilik

Örneklerin toplanmasıkodlanması ve dağıtımı

Dizileme tipi primerler vemetodun seçimi

Dizileme Merkezleri

Verilerin depolanmasıtransferi Biyoinformatik

Kalite kontrol

16S rRNADizileme

WGS

OTU FilotiplerRef GenomHaritalama

Metabolikyapılandırma

GruplamaFiltreleme

SınıflandırmaSınıflandırma

Genomunokunması

Gen veYolaklar

Verilerin olgunlaştırılması, fenotipler ile ilişkilendirme ve yorumlama

BirleştirmeDeğerlendirme

Metagenomve genler

Recommended