28
DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMA In’Tech : Bio- In’Tech : Bio- informatique informatique François Delfaud François Delfaud – 23 Octobre 2003 – – 23 Octobre 2003 –

DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

Embed Size (px)

Citation preview

Page 1: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION

In’Tech : Bio-informatiqueIn’Tech : Bio-informatiqueFrançois DelfaudFrançois Delfaud

– 23 Octobre 2003 – – 23 Octobre 2003 –

Page 2: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p2 More info at www.medit.fror by email at [email protected]

PlanPlan

1. Comprendre les fonctions protéiques à partir de modèles 3D

2. En bout de chaine de la bioinformatique: les outils de Drug Design

3. SuMo

4. MEDIT: une jeune start-up

Page 3: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p3 More info at www.medit.fror by email at [email protected]

-1- 3D & Fonctions -1- 3D & Fonctions les interactions atomiques observées les interactions atomiques observées• Exemple d’une protéase à sérine : la thrombine

• A l’échelle atomique : Caché derrière un Ki (une réaction): tout un chemin réactionnel Aspect entropique à 37°C (310°K) : ΔG= ΔH – T.ΔS Un très grand nombre de degrés de liberté

Triad Catalytique:Triad Catalytique:Asp-His-Asp-His-SerSer

…LDPRSFLLRN…

ThrombineThrombine

Trp60D : poche hydrophobe spécifiqueTrp60D : poche hydrophobe spécifique de cette sérine protéasede cette sérine protéase

Page 4: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p4 More info at www.medit.fror by email at [email protected]

• Interaction ionique

• Liaison hydrogène

• Interaction aromatique

• Interaction hydrophobe

-1- 3D & Fonctions -1- 3D & Fonctions Les interactions non covalentes stabilisantesLes interactions non covalentes stabilisantes

Page 5: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p5 More info at www.medit.fror by email at [email protected]

-1- 3D & Fonctions -1- 3D & Fonctions vers un modèle par approximations succéssivesvers un modèle par approximations succéssives

Modélisation Moléculaire Expérimental

Structure ImageT=0°K !

- à T=310°K Flexibilité

- Allostérie

Concentration 1,66.10-24 mol/l

1 molécule simulée ! (ou quelques)

Seuil de détection = Picomol

Mesure=Observable => Effet de moyenne

Environnement Pour certains modèles:- Solvant- Sels- Membrane cellulaire …

Infiniment complexe !

Echelle de temps

Simulation de l’ordre de la dizaine de Nano seconde (10-9s)

Reaction: kin et koff variant entre la nanosec et l’heure

RMN: moyenne dans le temps

Xray: effet de packing cristallin, facteur de température

Page 6: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p6 More info at www.medit.fror by email at [email protected]

-1- 3D & Fonctions -1- 3D & Fonctions Structure RX : exemple de la Thrombine Structure RX : exemple de la Thrombine

…LDPRSFLLRN…

ThrombineThrombine

19 structures RX superposées19 structures RX superposées

Glu192 très flexibleGlu192 très flexible

Ser195Ser195

Boucle d’autolyse peu ou pas résolue !Boucle d’autolyse peu ou pas résolue !

Trp60D boucle sixties: Trp60D boucle sixties: facteur temp. élevéfacteur temp. élevé

Page 7: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p7 More info at www.medit.fror by email at [email protected]

1. Comprendre les fonctions protéiques à partir de modèles 3D

2. En bout de chaine de la bioinformatique: les outils de Drug Design

3. SuMo

4. MEDIT: une jeune start-up

PlanPlan

Page 8: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p8 More info at www.medit.fror by email at [email protected]

-2- InSilico Drug Design : -2- InSilico Drug Design : Molecular ModelingMolecular Modeling

Genes

Target characterization

Generation of active molecules

Lead

Genomics and Proteomics Bioinformatics Tools

Ligand identification

Virtual screeningDeNovo Ligand Design3D PharmacophoreQSARDiversity selection

Hit optimization Selectivity profilingADME/Tox profiling

Protein Function/Structure determination

NMRXray DiffractionHomology ModelingStructure comparisonMolecular Dynamics

Target identification

Page 9: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p9 More info at www.medit.fror by email at [email protected]

1. Comprendre les fonctions protéiques à partir de modèles 3D

2. En bout de chaine de la bioinformatique: les outils de Drug Design

3. SuMo

4. MEDIT: une jeune start-up

PlanPlan

Page 10: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p10 More info at www.medit.fror by email at [email protected]

-3- SuMo : -3- SuMo : Collaboration avec l’IBCPCollaboration avec l’IBCP

• Unique technology to compare surfaces and detect similarities between macromolecular structure VERY fast Unique annotation to characterize the function from a 3D generated

model Under discussion with the FIST & C. Geourjon

Subtilisin Trypsin

Same function but only active site is similar and No sequence similarity

Page 11: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

analogie locale

squelette différent

-3- SuMo -3- SuMo Evolution ConvergenteEvolution Convergente

Page 12: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

squelette et séquences semblables

fonctions différentes ou antagonistes

10 20 30 40 50 60 70 80 90 100 110 120 | | | | | | | | | | | |2PELAx0 AETVSFNFNSFSEGNPAINFQGDVTVLSNGNIQLTNLN-----KVNSVGRVLYAMPVRIWSSATGNVASFLTSFSFEMKDIKDYDPADGIIFFIAPEDTQIPAGSIGGGTLGVSDTKGAGHFVGV1IOAAx1 ATETSFNFPNFHTDDKLI-LQGNATISSKGQLQLTGVGSNELPRVDSLGRAFYSDPIQIKD--SNNVASFNTNFTFIIRAKNQSISAYGLAFALVPVNSPPQKKQEFLGIFNTNNPEPNARTVAV * .**** .* .: * :**:.*: *:*::***.:. :*:*:**.:*: *::* . :.***** *.*:* :: :: .* *: * :.* :: . * :...:.: .: *.*Prim.cons. A222SFNF22F222222IN2QG22T22S2G22QLT222SNELP2V2S2GR22Y22P22I22SA22NVASF2T2F2F2222222222A2G22F222P222222222222G2222222222222V2V

135 145 155 165 175 185 195 205 215 225 235 245 | | | | | | | | | | | |2PELAx0 EFDTYSNSEYNDPPTDHVGIDVNSVDSVKTVPWNSVSGAVVKVTVIYDSSTKTLSVAVTNDNGDITT-IAQVVDLKAKLPERVKFGFSASG--SLGGRQIHLIRSWSFTSTLITTTRRS------1IOAAx1 VFNTFKNR--IDFDKNFIKPYVN-----ENCDFHKYNGEKTDVQITYDSSNNDLRVFLHFTVSQVKCSVSATVHLEKEVDEWVSVGFSPTSGLTEDTTETHDVLSWSFSSKFRNKLSNILLNNIL *:*:.* * .:.: ** :. ::. .* ..* : ****.: * * : .::. :: .*.*: :: * *..***.:. : . : * : ****:*.: .. . Prim.cons. 2F2T22N2EY2D222222222VNSVDSV222222222G2222V222YDSS222L2V22222222222S2222V2L22222E2V22GFS222GL2222222H222SWSF2S222222222LLNNIL

-3- SuMo -3- SuMo Evolution DivergenteEvolution Divergente

Page 13: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

séquence

chaîne principale

groupements d'atomes

ACGYVRLAKCDDY-x(2)-[LV]-x-KC

-3- SuMo -3- SuMo les différents niveaux d'étude des protéinesles différents niveaux d'étude des protéines

Page 14: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

Affichage et visualisation

SuMo

Sites 3D de fixation de ligands

(12000 sites sélectionnés)

Structure 3D

d'intérêt

PDB (21000 structures publiques)

SuMo server

-3- SuMo -3- SuMo Prédiction de sites de fixation de ligands Prédiction de sites de fixation de ligands par SuMo par SuMo

Page 15: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

élément abstrait ponctuel

groupe d'atomes instanciation selon

l'environnement

position position physique position fonctionnelle

géométrie propre

aromatique

donneur de liaison H

donneur de liaison H

accepteurde liaison H

-3- SuMo -3- SuMo Définition des groupements chimiquesDéfinition des groupements chimiques

Page 16: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

Amas globulairenon orienté

ex : charge + ou -Polarisation simple

ex : dipôle

Polarisation symétrique

ex : plan aromatique

Double polarisation semi-symétrique

ex : acide carboxylique

Double polarisationex : amide

-3- SuMo -3- SuMo Géométrie des groupements chimiquesGéométrie des groupements chimiques

Page 17: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

instanciation des groupements chimiques

sélection de groupements chimiques

création automatique de triplets

Formation de triplets

Sélection de groupements chimiques

P1

P2P3

-3- SuMo -3- SuMo Triplets de groupements chimiquesTriplets de groupements chimiques

Page 18: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

T3

T2

T1T4

Groupements chimiques

Graphe des triplets de

groupements chimiques

Base de données

Utilisation(comparaisons)

T3

T2

T1T4

-3- SuMo -3- SuMo Représentation finale des moléculesReprésentation finale des molécules

Page 19: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

formation des paires de triplets similaires

connexion des paires voisines

extraction des sous-graphes indépendants

T1

T2

T3

T4

T1'

T5'

T3'

T2'

T4'

T3/T3'

T2/T2'

T1/T1'

T4/T4'

-3- SuMo -3- SuMo Heuristique d'extraction des listes Heuristique d'extraction des listes de correspondances de correspondances

Page 20: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

Critères essentiels groupements chimiques de même type distances similaires orientation similaire similarité de forme de l'environnement local

Autres critères enfouissement similaire (densité atomique) disposition du triplet par rapport à la protéine

-3- SuMo -3- SuMo Critères de similitude des triplets Critères de similitude des triplets

Page 21: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

programme sumo (157 modules, 20000 lignes) : Langage OCaml (Développé par l’INRIA)

programme central

utilisation locale ou indirecte, langage sumo

interface web (10000 lignes) HTTP/CGI/HTML

requêtes interactives ou via langage SuMoQ

optimisation des ressources de calcul machines multiprocesseurs

clusters

-3- SuMo -3- SuMo les différentes composantes de SuMoles différentes composantes de SuMo

Page 22: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

Interfaces entre SuMo et les plate-formes de modélisation moléculaire (SPL, SVL, VB)

intégration dans un pipeline de modélisation et drug design

-3- SuMo -3- SuMo Les développements en cours (MEDIT)Les développements en cours (MEDIT)

Page 23: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p23 More info at www.medit.fror by email at [email protected]

1. Comprendre les fonctions protéiques à partir de modèles 3D

2. En bout de chaine de la bioinformatique: les outils de Drug Design

3. SuMo

4. MEDIT: une jeune start-up

PlanPlan

Page 24: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

Contract Contract researchresearch

Service IntegrationService Integration

Commercial Commercial softwaresoftware

Grid ComputingGrid Computing

olecularolecular

xtendedxtended

istributionistribution

nformationnformation

echnologyechnology

inin

MEDIT distributionMEDIT distributionBioinfoBioinfoCheminfoCheminfoMol.ModelingMol.Modeling

Page 25: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p25 More info at www.medit.fror by email at [email protected]

-4- MEDIT-4- MEDIT exemple de produit en R&Dexemple de produit en R&D

-0.5

0.0

0.5

1.0

1.5

3D model generation from multiple sequence alignment

- for low homology area- to score the quality of the model

FASTER with Grid Computing – Can process full proteome FASTER with Grid Computing – Can process full proteome

- Unique annotations to characterize the function from a 3D generated model

MED-3DgenMED-3Dgen MED-ProScore MED-ProScore MED-SuMo MED-SuMo

Page 26: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p26 More info at www.medit.fror by email at [email protected]

Protéine cible (fichier PDB):

Extraire une carte d’interaction avec les points pharmacophoriques

N Ligands (fichier SD):

Pour chaque ligand n : recherche conformationnelle par Distance Geometry et/ou recuit simulé K conformations

Pour chaque conformation N°k : extraction des points pharmacophoriques

Prot

Don

Don

Acc

HydAcc

Passage aux points pharmacophoriques projetés

Hyd Don1

Don2

Acc1

-4- MEDIT-4- MEDIT R&D autour du dockingR&D autour du docking

Page 27: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

In’Tech Presentation – Oct 23rd 2003 - p27 More info at www.medit.fror by email at [email protected]

-4- MEDIT-4- MEDIT services en informatique et contrats de rechercheservices en informatique et contrats de recherche

• Molecular Modeling contract research Virtual screening including selectivity prediction 1D-2D-3D molecular descriptors to QSAR model generation Homology modeling for Proteomics or Pharmacogenomics purposes QM/MM reactivity prediction profile … Training All can be done on a linux farm or with Grid Computing

• Software development C++, VB, Java, Python, PERL development Corba, XML, .NET, SOAP web services MySQL, PostGreSQL databases Unix, Linux administration

x10 to x1000 (or more) time faster !

Page 28: DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –

MerciTo contact M.E.D.I.T. : Parc Théogone, Toulouse, France

Rue du Belvédère, Palaiseau, France

Tel: +33 (0)6 855 66 722http://www.medit.fr & [email protected]