21
Biochimica - Laboratorio di Bioinformatica I (CdL. Bioinformatica) Bioinformatica e banche dati biologiche (CdL. Biotecnologie) Modulo Laboratorio Docente: Dr. Sergio Marin Vargas Mail: [email protected] Ufficio: Ca Vignal 1, Piano -1, Stanza: S14 (Lab. di Bioinformatica) Ricevimento: previo appuntamento via mail oppure al 0458027905 Modulo Laboratorio A.A. 2014/2015

Modulo Laboratorio A.A. 2014/2015 - molsim.sci.univr.itmolsim.sci.univr.it/.../01_a_Introduzione_alla_Bioinformatica.pdf · Biochimica -Laboratorio di Bioinformatica I (CdL. Bioinformatica)

Embed Size (px)

Citation preview

Biochimica - Laboratorio di Bioinformatica I (CdL. Bioinformatica)

Bioinformatica e banche dati biologiche (CdL. Biotecnologie)

Modulo Laboratorio

Docente: Dr. Sergio Marin Vargas

Mail: [email protected]

Ufficio: Ca Vignal 1, Piano -1, Stanza: S14 (Lab. di Bioinformatica)

Ricevimento: previo appuntamento via mail oppure al 0458027905

Modulo Laboratorio

A.A. 2014/2015

LaboratorioGiovedì dalle 11:30 alle 14:30 – Laboratorio DeltaGiovedì dalle 11:30 alle 14:30 – Laboratorio Delta

La frequenza non è obbligatoria ma vivamente consigliata.

Pagine ufficiali del corso:

Materiale Didattico della parte di Laboratorio:http://molsim.sci.univr.it/bioinfo/web/index.php?option=com_wrapper&view=wrapper&Itemid=83

Pagine ufficiali del corso:

� Biochimica - Laboratorio di Bioinformatica I (CdL. Bioinformatica)

http://www.di.univr.it/?ent=oi&cs=419&discr=&discrCd=&id=88039

� Bioinformatica e banche dati biologiche (CdL. Biotecnologie)

http://www.dbt.univr.it/?ent=oi&codiceCs=S21&codins=4S02701&cs=385&discr=&discrCd

S. Pascarella, A. PaiardiniBioinformaticaDalla sequenza alla struttura delle proteineZanichelli

Per il modulo di laboratorio non sono necessari libri di testo, il consiglio e di seguire

l’esercitazioni, comunque possono essere utilizzati gli stessi libri della teoria.

Arthur M. LeskIntroduzione alla bioinformatica, MgGraw HillAnna TramontanoBioinformatica, ZanichelliG. Valle e altri.Introduzione alla Bioinformatica , Zanichelli

Jonathan PevsnerBioinformatics and Functional Genomics (2nd ed.) Wiley-Blackwell

Zanichelli

4

� Ci sarà un unico esame, con una parte di teoria (Prof. Alberto Ferrarini) e una

parte di laboratorio, quindi ci sarà un unico voto complessivo.

� Le domande della parte di laboratorio saranno a risposte multiple ma riferiti ad

esercizi pratici al computer, come quelli che realizzeremmo durante

l’esercitazioni del corso.l’esercitazioni del corso.

� Per gli studenti del CdL di Biotecnologie, la verbalizzazione del voto del corso

“Bioinformatica e Banche dati biologiche” verrà effettuata dal Prof. AlbertoFerrarini (6 crediti).

� Per gli studenti del CdL di Bioinformatica, il voto complessivo del modulo

“Biochimica - LABORATORIO DI BIOINFORMATICA I” farà poi media col

modulo “Elementi di Biochimica” della Prof.ssa Paola Dominici, sarà poi lei

chi verbalizzerà il voto complessivo (12 crediti).

� Introduzione alla bioinformtica e all’utilizzo dei computer del laboratorio• Breve introduzione alla bioinformatica• Utilizzo del computer, concetti basici di linux• Utilizzo del computer, esercizi di linux

� Introduzione ai database bioinformatici• NCBI: l’interfaccia Entrez, Gene, Unigene,

Protein

� Banche dati per la proteomica strutturale:• Introduzione al formato di annotazione

strutturale delle proteine (PDB)• Esercizi su PDB (Protein Data Bank)• Esercizi su banche dati di strutture proteiche:

SCOP, CATH� Metodi per predire strutture secondarie e

caratteristiche di proteine• PSI-PRED, JPRED e database di famiglie • Uniprot

• PubMed e Google Scholar� Allineamenti a coppie

• Matrici a punti• Matrici di punteggio e metodi ottimali: strumenti

online ed esempi� BLAST e PSI-BLAST

• Risorse online per le ricerche con Blast� Strumenti per gli allineamenti multipli

• Banca dati Homologene e risorse online per il calcolo e la visualizzazione di allineamenti multipli

� Strumenti per la filogenesi:

• Mobyle dell’Institut Pasteur e Phylogeny.fr

• PSI-PRED, JPRED e database di famiglie strutturali

� Visualizzazione di proteine, acidi nucleici e complessi• Visualizzazione e grafica molecolare: utilizzo di

PyMol per visualizzazione di proteine, acidi nucleici e complessi

• Visualizzazione di proteine con VMD (Visual Molecular Dynamics)

� Introduzione alla genomica• Introduzione al formato di annotazione di genomi

(GFF3)• Esercizi su banche dati di dati genetici• Esercizi su Genome Browser (Ensembl, UCSC,

NCBI e IGV)

� Wikipedia: La bioinformatica è una disciplina scientifica dedicata alla risoluzionedi problemi biologici conmetodi informatici.

� La bioinformatica è la disciplina scientifica che cerca di risolvere problemibiologici mediante l’elaborazione informatica dell’informazione provenientediretta o indirettamente da essere viventi.

� Tipi di informazione:� Sequenze genomiche (DNA).� Sequenze proteiche (Polipeptidi).� Sequenze proteiche (Polipeptidi).� Strutture 3D di proteine (NMR,

Cristallografia) cioè biologia strutturale.� Immagini (RX,TAC, MRI, US, ecc).� Concentrazioni di proteine o altre

molecole nella cellula.� Concentrazioni dei diversi corpuscoli del

sangue.� Informazione di interazione tra geni, tra

proteine, ecc (systems biology).� Pulsazioni, respiri, battiti cardiaci, ecc.� Qualsiasi altro dato che possa essere

estratto da una forma di vita.

GenomicaTrascrittomica

Proteomica Metabolomica

� La genomica è una branca della biologia molecolare che si occupa dello studiodel genoma degli organismi viventi. In particolare si occupa della struttura,contenuto, funzione ed evoluzione del genoma. È una scienza che si basasulla bioinformatica per l'elaborazione e la visualizzazione dell'enorme quantità didati che essa produce.

� Estrazione e/o cattura del DNA da essere� Estrazione e/o cattura del DNA da essereviventi.

� Sequenziamento del DNA tramite tecnologieNGS (Next Generation Sequencing).

� Assemblaggio di genomi.� Ri-sequenziamento di genomi.� Annotazione di genomi.� Annotazione funzionale dei geni all’interno di

un genoma.� Analisi di espressione genica mediante

sequenziamento dei trascritti (RNA-Seq).� GWAS (GenomeWideAssociation Studies).� Analisi di varianti genetiche.

� La trascrittomica è una branca della biologia molecolare che studia l'insiemedegli RNA messaggeri di una cellula chiamato anche trascrittoma. Dagli RNAmessaggeri, attraverso il processo di traduzione, derivano le proteine di cui sonocostituiti gli organismi viventi.

� La proteomica è una branca della biologia molecolare che consistenell'identificazione sistematica di proteine e nella loro caratterizzazione rispettoa struttura, funzione, attività, quantità e interazioni molecolari.

� La metabolomica è una branca della biologia molecolare che si occupa dellostudio di come interagiscono metaboliti e proteine nel metabolismo dellacellula. Il metaboloma rappresenta l'insieme di tutti i metaboliti di un organismobiologico, che sono i prodotti finali dell’espressione genica. E così, mentre i datidell'espressione genica dell'mRNA e delle analisi proteomico non spieganoesaurientemente ciò che succede in una cellula, il profilo metabolico può fornireun'istantanea della fisiologia di quella cellula.un'istantanea della fisiologia di quella cellula.

� La biologia di sistemi è una branca della biologia molecolare che studia gliorganismi viventi in quanto sistemi che si evolvono nel tempo, ossianell'interazione dinamica delle parti di cui sono composti. In particolare questoobiettivo viene conseguito tramite l'integrazione di modelli dinamici e dei risultatidi differenti esperimenti ad alto rendimento, unendo nella pratica per esempio leconoscenze di genomica, proteomica, trascrittomica e di teoria deisistemi dinamici.sistemi dinamici.

� La Biologia Strutturale è una sottobranca della Proteomica che si occupa dellostudio della struttura delle macromolecole biologiche, principalmente proteine eacidi nucleici. Grazie al ripiegamento delle proteine in una specifica struttura 3D,che esse, sono in grado di realizzare le loro funzioni, quindi conoscere la struttura3D è fondamentale per capire il loro funzionamento.

� Metodi di caratterizzazione della struttura di una proteina:� Metodi di caratterizzazione della struttura di una proteina:� Cristallografia a RX� NMR (risonanzamagnetica)� Predizionemediante BiologiaComputazionale

� La Biologia Computazionale consiste nell’applicare strumenti propri delle scienze dell’informazione(es. algoritmi, intelligenza artificiale, databases) a problemi di interesse biologico, biotecnologico ebiomedico.

� Nel caso della Biologia Strutturale, consiste nell’applicare strumenti informatici per predire la struttura3D de una proteina o per fare una simulazione computazionale del suo comportamento dinamico, conlo scopo di caratterizzare la funzione della stessa.

� Metodi di biologia computazionale sono:

� Molecular Docking� Molecular Docking

� HomologyModeling

� Molecular Dynamics

� L’elaborazione di immagini biomediche è una branca della bioinformatica che sioccupa della comprensione e dell'estrazione di informazione da immagini esegnali biomedici. Esso quindi analizza le caratteristiche dei segnali biologicimaggiormente utilizzati nella pratica clinica e quelle delle diverse tipologie di“imaging diagnostico” (come ad esempio: RX, TAC, MRI, US, EEG, ECG, ecc). Loscopo principale è quello di fornire strumenti di diagnosi in ambito medico.