View
71
Download
0
Category
Preview:
Citation preview
Interpretare il codice della vita con l’Intelligenza Artificiale
Monica BianchiniUniversità degli Studi di Siena
Dipartimento di Ingegneria dell’Informazione e Scienze Matematiche
I motori della vita
Le proteine sono macromolecole costituite da venti diversi tipi di amminoacidi, legati in successione mediante legami peptidici
Folding proteico
È la struttura nativa di una proteina che ne determina la funzione
In condizioni fisiologiche, le proteine, sintetizzate come polimeri lineari, collassano e si modellano in complesse strutture tridimensionali, dette strutture native Il meccanismo di avvolgimento della catena polipep-tidica, il folding, rappresenta il passaggio conclusivo del trasferimento dell’informazione genetica dal DNA al suo prodotto finale, il proteoma
Folding proteico
Il numero di folding distinti (700), assunti dalle proteine osservate finora, sono il risultato della com-binazione di un piccolo numero di semplici motivi strutturali locali
eliche foglietti
Predizione delle strutture proteiche
Perché studiare la struttura 3D di una proteina?Il confronto tra strutture proteiche
mette in luce relazioni evolutive difficilmente rilevabili tramite confronto fra sequenzepermette la predizione della funzione di nuove proteine sulla base della struttura di proteine note
Le proteine sono molecole flessibili: conoscere la struttura 3D, e poterne descrivere l’evoluzione superficiale, apre la strada alla progettazione di nuovi farmaci
Cosa abbiamo a disposizione? Banche dati biologiche (es.: PDB), perennemente
aggiornate ed in continua espansione necessità di operare in tempo reale
All’interno delle biobanche, dati annotati, “per cui la soluzione del problema è nota”
Gli strumenti dell’Intelligenza Artificiale, in parti-colare le Reti Neurali Artificiali
Sono in grado di apprendere da esempi, inferendo regole dall’osservazione e mimando il processo cognitivo biologico
Predizione delle strutture proteiche
Nelle reti neurali, l’apprendimento si realizza tramite l’aggiustamento dei pesi sinaptici, effettuato su un sottoinsieme dei datiLa rete svilupperà memoria e capacità di estrapola-zione così da “rispondere correttamente” a nuovi stimoli, purché congruenti con quanto ha appreso
Le Reti Neurali Artificiali
Predizione della struttura secondariaClassificazione delle eliche
Contesto C
Residuo R Finestra W
O Onon_
Rete Neurale
I migliori metodi numerici di predizione delle strut-tura secondaria utilizzano reti neurali
Predizione della struttura secondariaClassificazione delle eliche
Set dalla banca dati
Mapping noto
Conoscenza codificata nei pesi
Nuova sequenza
Mapping dipredizione
Addestramento Predizione
Quando residui di cisteina, lontani nella struttura primaria della proteina, si trovano vicini nello spazio 3D, possono formare legami disolfuro covalenti I ponti disolfuro producono un effetto stabilizzante significativo sulla struttura ripiegata di una proteina
Verso la predizione della struttura 3DI ponti disolfuro
Predizione dei ponti disolfuro
S
SC CC
C
1 MVKGPGLYTDIGKKARDLLYKDYHS--DKKFTISTYSCTGVAITSSGTKKGEL--FLGDV2 SAKGPGLYTDIGKKARDLLYRDYQT--DQKFSITTYSCTGVAITSSGTKKGDL--FLADV3 MVKGPGLYSDIGKRARDLLYRDYQS--DHKFTLTTYTCNGVAITSTGTKKGEL--FLADV4 MVKGPGLYSDIGKKARDLLYRDYVS--DHKFTVTTYSCTGVAITASGLKKGEL--FLADV5 MVKGPGLYTEIGKKARDLLYRDYQG--DQKFSVTTYSCTGVAITTTGTNKGSL--FLGDV6 MVVAVGLYTDIGKKTRDLLYKDYNT--HQKFCLTTSSCNGVAITAAGTRKNES--IFGEL7 -MGGPGLYSGIGKKAKDLLYRDYQT--DHKFTLTTYTCNGPAITATSTKKADL--TVGEI8 AVVRPYADLGKSARDVFTKGYGFG-LIKLDLKTKSENGLEFTSSGSANTETTKVTGSLEI9 --AVPPTYADLGKSARDVFTKGYGFG-LIKLDLKTKSGNGLEFTSSGSANTETTKVTGSL10 -MAVPPTYADLGKSARDVFTKGYGFG-LIKLDLKTKSGNGLEFTSSGSANTETTKVNGSL11 --AVPPSYADLGKSARDIFNKGYGFG-LVKLDVKTKSCTGVEFTTSGTSNTDSGKVNGSL12 --MAPPSYSDLGKQARDIFSKGYNFG-LWKLDLKTKTCSGIEFNTAGHSNQESGKVFGSL13 --MAVPAFSDIAKSANDLLNKDFYHLAAGTIEVKSNTCNNVAFKVTGKSTHDK-VTSGAL
Bonding Non bonding
Verso la predizione della struttura 3DI ponti disolfuro
Concludendo…
La struttura secondaria di una proteina può essere predetta con accuratezza significativa (75%) usando le tecniche dell’Intelligenza Artificiale e, in particolare, le reti neurali artificialiLa struttura terziaria è molto più difficile da predire, ma si può ricostruire a partire dalla predizione dei contatti fra amminoacidi lontani nella sequenza proteicaConoscere la truttura 3D delle proteine significa cono-scerne la funzione, cioè determinare quali informazioni sono biologicamente significative per la crescita, la riproduzione, l’evoluzione delle specie viventi
Recommended