Adriana Maggi DOCENTE DI BIOTECNOLOGIE FARMACOLOGICHE CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE...

Preview:

Citation preview

Adriana Maggi

DOCENTE DI BIOTECNOLOGIE FARMACOLOGICHECORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO

AA 2011/2012Lezione 6

Bioinformatica nel processo di drug discovery

Bioinformatics in the drug discovery process

Alessandro VillaCenter of Excellence on Neurodegenerative Diseases

Department of Pharmacological SciencesUniversity of Milan

Recently invented methods allow researchers to analyze the expression of thousands of genes simultaneously using DNA microarrays. Coupling these methods with the results from genome sequencing projects allows researchers to analyze the complete transcriptional program of an organism during specific physiological responses or developmental processes.

Genome-wide studies

• I chip a DNA sono costituiti da un array di microscopiche aree, ciascuna contenente 107 sonde identiche di 20-50 pb, covalentemente fissate al supporto (vetro, plastica, silicio o beads di polistirene)

• Sfruttano una tecnica di ibridazione inversa: le probe sono fissate al supporto (in una posizione nota), mentre i frammenti di DNA da analizzare (target) sono marcati con biotina o con marker fluorescenti e ibridizzati alle sonde

• Il DNA target, legato alla sonda, può essere identificato utilizzando uno scanner, capace di rivelare il segnale emesso

Cosa sono i chip a DNA

• I chip a DNA sono costituiti da un array di microscopiche aree, ciascuna contenente 107 sonde identiche di 20-50 pb, covalentemente fissate al supporto (vetro, plastica, silicio o beads di polistirene)

• Sfruttano una tecnica di ibridazione inversa: le probe sono fissate al supporto (in una posizione nota), mentre i frammenti di DNA da analizzare (target) sono marcati con biotina o con marker fluorescenti e ibridizzati alle sonde

• Il DNA target, legato alla sonda, può essere identificato utilizzando uno scanner, capace di rivelare il segnale emesso

Cosa sono i chip a DNA

• I chip a DNA sono costituiti da un array di microscopiche aree, ciascuna contenente 107 sonde identiche di 20-50 pb, covalentemente fissate al supporto (vetro, plastica, silicio o beads di polistirene)

• Sfruttano una tecnica di ibridazione inversa: le probe sono fissate al supporto (in una posizione nota), mentre i frammenti di DNA da analizzare (target) sono marcati con biotina o con marker fluorescenti e ibridizzati alle sonde

• Il DNA target, legato alla sonda, può essere identificato utilizzando uno scanner, capace di rivelare il segnale emesso

Cosa sono i chip a DNA

• FOTOLITOGRAFIA (in situ):Fasci di luce e maschere fotolitografiche sono utilizzati per produrre le sonde direttamente sul supporto;

• SPOTTED MICROARRAYS:Le sonde sono sintetizzate prima della loro deposizione sull’array, e solo successivamente “spottati” sul supporto.

Come si producono

Microarray e Tiling array

• MICROARRAY DI ESPRESSIONE: le sonde utilizzate rappresentano porzioni di trascritti noti

Gene 1 Gene 2

• TILING ARRAYS: coprono l’intero genoma o porzioni definite di genoma (tutti i promotori, solo alcuni cromosomi…)

Gene 1 Gene 2

Quali utilizzi hanno

• MICROARRAY DI ESPRESSIONE: utilizzati quasi esclusivamente per l’analisi dei livelli di espressione di trascritti noti, confrontata in diverse condizioni (es. controllo-trattamento, cellula sana-cellula tumorale etc.)

Gene 1 Gene 2

• TILING ARRAYS: Utilizzati per• analisi unbiased dell’espressione genica (geni non noti e miRNA);• ChIP-on-chip (chromatin immunoprecipitation on a chip)• Array CGH (comparative genomic hybridization): tecnica usata in

diagnostica per l’individuazione di copy number variations e anomalie del DNA

Gene 1 Gene 2

Applicazioni

Tiling Arrays

Analisi delle regioni di binding sulla cromatina di ERalfa nelle due diverse condizioni

Dove si localizza ERalfa?La sua localizzazione è influenzata dal trattamento / condizione fisiologica/

patologia?

Microarray di espressione

Analisi delle differenze di espressione genica nelle due diverse condizioni

Il trattamento/ diversa condizione fisiologica / patologia influenzano

l’espressione genica? Quali sono i geni differenzialmente espressi?

Workflow

Output

Analisi dei Dati

Risultati

Microarray

Workflow

Congelamento

Estrazione RNA

RetrotrascrizioneMic

roarr

ays

Marcatura Ibridazione

GeneChip Mouse Genome 430 2.0 Array – Affymetrix39.000 transcripts1 expression array

Output

Quasi 40.000 trascritti conosciuti

Intensità CEL fileNormalizzazione RMA file

• MeV: MultiExperiment Viewer (MeV)da TM4 microarray software suite http://www.tm4.org/ free

• Rosetta Resolver System: http://www.rosettabio.com/

• Genomatix: http://www.genomatix.de

•dChip: http://biosun1.harvard.edu/complab/dchip/

Output – software di analisi dati

Lista di geni differenzialmente espressi nelle due condizioni (veh-trattato; etc.) in un file

Analisi dei dati

Come otteniamo informazioni da questa lista di geni?

Analizzandoli uno ad uno…. … o utilizzando specifici software che consentono di ottenere in

modo semplice informazioni sulla funzione dei geni identificati

ONTOLOGIES

• GENE ONTOLOGY: può essere considerato una specie di enciclopedia che raccoglie tutte le informazioni disponibili sui geni noti, attraverso delle definizioni e delle parole chiave condivise.

• E’ suddiviso in 3 categorie:• Processi biologici • Funzioni molecolari • Componenti cellulari

Un prodotto genico ha una o più funzioni cellulari, può essere coinvolto in diversi processi biologici e infine potrebbe essere associato a diversi compartimenti cellulari.

http://www.geneontology.org/

http://david.abcc.ncifcrf.gov/home.jsp

Analisi dei dati

Phosphomevalonate kinase

Workflow e messa a punto

Output

Analisi dei dati

Risultati

ChiPOnchip

Workflow e messa a punto

Sonicazione

Ch

IP-c

hip

Crosslinking

500

100

Immunopre-cipitazione DNA

mRNA

Binding RegionsDNA

mRNA

Binding Regions

Y

Crosslinking inversoPurificazione DNA

LM-AmplificationFrammentazione

Marcatura Ibridazione

Output

Cutoff

1. Rilevazione del segnale relativo alle sequenze Chipped, e posizionamento sul DNA

2. Definizione dei picchi relativi alle regioni di binding tramite specifico algoritmo

3. Normalizzazione e analisi dei picchi che superano il limite di cutoff

Output

Chr 10

23476246 23477332

BED file

• UCSC Genome Browser

• INTEGRATED GENOME BROWSER (IGB)

Bed Files visualization

Add custom track

• CISTROME ANALYSIS PIPELINE MODULE

Bed Files analysis

Ingenuity Pathway Analysis Software

http://www.ingenuity.com/index.html

Recommended