Développement d'un portail web pour le criblage virtuel sur la grille de calcul

  • Số trang: 79 |
  • Loại file: PDF |
  • Lượt xem: 14 |
  • Lượt tải: 0
nhattuvisu

Đã đăng 26946 tài liệu

Mô tả:

Institut de la Francophonie pour l’Informatique Mémoire de fin d’études pour l’obtention du diplôme de Master II Informatique Option : Réseaux et Systèmes Communicants Développement d’un portail web pour le criblage virtuel sur la grille de calcul Promotion 17-RSC Rédigé par : Louacheni Farida Sous l’encadrement de : Dr.Nguyen Hong Quang Dr.Doan Trung Tung Dr.Bui The Quang 20 novembre 2014 Remerciements Ce travail de stage de fin d’études a été effectué au sein du Laboratoire MSI à l’Institut de la Francophonie pour l’Informatique, sous la direction du Docteur Nguyen Hong Quang, auquel je tiens à exprimer ma profonde gratitude, et ma vive reconnaissance pour m’avoir confié ce sujet. J’adresse mes plus vifs remerciements au Dr.Doan Tung Tung et Dr.Quang Bui The de m’avoir encadré et prodigué maints conseils. Je suis très reconnaissante à tous les enseignants de l’IFI pour la qualité de l’enseignement qu’ils nous ont offerts. Ma reconnaissance infinie à mes très chers parents qui m’ont enseigné la persévérance dans mes études, qui m’ont toujours été d’un grand secours par leur soutient et leur encouragement, ainsi mes adorables soeurs et mon très cher frère et mon ami Yacine-Malek. Enfin, un immense merci à mes amis qui m’ont toujours soutenue. i Résumé À l’heure actuelle, la grille de calcul est en train de devenir une force motrice majeure pour de nouvelles approches pour la collaboration de science à grande échelle. Plusieurs programmes nationaux et internationaux eScience ont favorisé la collaboration entre chercheurs de différents domaines scientifiques. Dans le domaine biomédicale, plus précisement dans la recherche de nouveaux médicaments pour les maladies infectieuses. La grille de calcul a initié plusieurs projets à grande échelle dans les approches de criblage de médicaments in-silico. Le projet WISDOM a été parmi les premiers projets dans le domaine public qui a fait usage de la grille tout en permettant le docking in-silico pour simuler l’interaction de médicaments potentiels avec des protéines cibles. Le docking in-silico est la première étape dans le processus de criblage virtuel, il est considéré comme l’une des approches les plus prometteuses afin accélérer et de réduire les coûts de développement de nouveaux médicaments pour les maladies négligées. Bien que, de nombreuses applications ont été développées pour permettre le criblage virtuel dont le but d’accélérer le processus de recherche des médicaments. Une barrière critique de ces programmes est leur complexité en terme d’utilisation et de prévoir des procédures concises pour les utilisateurs réguliers. L’objectif de ce travail est de développer un portail web conviviale pour effectuer le criblage virtuel, et de déployer un très grand nombre de docking sur la grille de calcul. Pour atteindre ce but, la grille de calcul a été utilisé pour accélérer la recherche et la découverte de nouveaux médicaments in-silico et traitements pour les maladies infectieuses. ii Abstract Grid computing is currently developing into a major driving force for new approaches towards collaborative large scale science. Several national and international eScience programs have fostered collaboration between researchers from different scientific domains. In the biomedical field, more precisely in drug discovery for infectious diseases. Grid computing has initiated several projects on large scale in-silico drug screening approaches. The project WISDOM was amongst the first projects in the public domain that made use of grid enabled in-silico docking to simulate the interaction of potential drugs with target proteins. In-silico docking is the first step in the virtual screening process, which is one of the most promising approaches to speed-up and to reduce the costs of the development of new drugs. Although, many applications have been developed to allow in-silico screening, but a critical barrier of these programs is the lack of a suitable, easy, simple way to use and to provide concise procedures for regular users. The main goal of this work is to develop a user-friendly web portal to perform virtual screening and to deploy a large number of docking on grid computing. To achieve this goal, the grid computing was used to accelerate research and discovery of new drugs in-silico for infectious diseases. iii Table des matières 1 Introduction 1.1 Problèmatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Notre contribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Plan du mémoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 État de l’art 2.1 Conception de médicaments in-silico . . . . . . . . . . . . . 2.2 Criblage virtuel ”Vitual Screening” . . . . . . . . . . . . . . 2.2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Découverte de nouveaux médicaments avec le criblage 2.2.3 Les différentes stratégies du criblage virtuel . . . . . 2.2.4 Criblage virtuel à haut débit . . . . . . . . . . . . . 2.2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Docking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Approches du docking . . . . . . . . . . . . . . . . . 2.3.3 Principe du docking . . . . . . . . . . . . . . . . . . 2.3.4 Outils de Docking . . . . . . . . . . . . . . . . . . . . 2.3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . 2.4 AutoDock . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Docking avec AutoDock . . . . . . . . . . . . . . . . 2.4.2 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Grille de calcul . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . 2.5.2 Grille de calcul . . . . . . . . . . . . . . . . . . . . . 2.5.3 Organisation virtuelle . . . . . . . . . . . . . . . . . . 2.5.4 Architecture générale d’une grille de calcul . . . . . . 2.5.5 Composants de la grille . . . . . . . . . . . . . . . . . 2.5.6 Fonctionnement de la grille . . . . . . . . . . . . . . 2.5.7 Avantages & Défis de la grille . . . . . . . . . . . . . 2.5.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Portail GVSS . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . 2.6.2 La plate-forme GAP . . . . . . . . . . . . . . . . . . 2.6.3 Architecture GVSS . . . . . . . . . . . . . . . . . . . 2.6.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Plate-formes utilisés . . . . . . . . . . . . . . . . . . . . . . 2.7.1 WISDOM . . . . . . . . . . . . . . . . . . . . . . . . 2.7.2 DIRAC . . . . . . . . . . . . . . . . . . . . . . . . . i . . . . . . . . . . . . virtuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 2 2 3 3 4 4 6 6 7 7 9 9 10 11 12 13 14 15 17 18 18 18 19 20 21 22 24 24 26 26 27 28 29 30 30 33 3 Implémentation 3.1 Architecture du système proposée 3.2 Outils utilisés . . . . . . . . . . . 3.3 Conception du portail . . . . . . 3.4 Développement du portail du web 3.4.1 Les services web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 37 38 41 48 48 4 Expérimentation & Résultats 52 4.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5 Conclusion & perspective 64 ii Table des figures 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 Processus de conception de médicaments in-silico [11] . . Criblage Virtuel in-silico . . . . . . . . . . . . . . . . . . Docking protéine-ligand . . . . . . . . . . . . . . . . . . Étapes du Docking . . . . . . . . . . . . . . . . . . . . . Illustration de docking/scoring [6] . . . . . . . . . . . . . Comparaison des programmes de docking [16] . . . . . . Procédures de docking avec AutoDock . . . . . . . . . . La grille de calcul . . . . . . . . . . . . . . . . . . . . . . Couches de la grille de calcul . . . . . . . . . . . . . . . . Architecture de grille de calcul [10] . . . . . . . . . . . . Portail GVSS . . . . . . . . . . . . . . . . . . . . . . . . Architecture Service de criblage virtuel GAP (GVSS) [7] Architecture WPE [9] . . . . . . . . . . . . . . . . . . . . Intergiciel DIRAC . . . . . . . . . . . . . . . . . . . . . . Architecture DIRAC [20] . . . . . . . . . . . . . . . . . . Architecture du système proposée . . . . . . . . . . . . . Workflow soumission de job sur la grille avec Taverna . . Diagramme de classe du portail web . . . . . . . . . . . . Cas d’utilisation pour le Ligand . . . . . . . . . . . . . . Cas d’utilisation pour la Protéine . . . . . . . . . . . . . Cas d’utilisation pour les paramètres de grille . . . . . . Cas d’utilisation pour le docking . . . . . . . . . . . . . . Cas d’utilisation pour l’administrateur du portail . . . . Modèle MVC . . . . . . . . . . . . . . . . . . . . . . . . Description des services web implémentés . . . . . . . . . Workflow des services web du portail . . . . . . . . . . . Interface d’accueil du portail web . . . . . . . . . . . . . Interface de création d’un nouveau compte . . . . . . . . Interface d’authentification . . . . . . . . . . . . . . . . . Interface de gestion des utilisateurs . . . . . . . . . . . . Interface d’ajout d’un nouveau Ligand . . . . . . . . . . Interface de liste des Ligands disponibles . . . . . . . . . Interface de gestion des protéines . . . . . . . . . . . . . Interface de modification d’une protéine . . . . . . . . . Interface d’ajout de fichier de paramètres de la grille . . Interface d’ajout d’un nouveau projet de docking . . . . Vérification d’ajout du nouveau projet . . . . . . . . . . Soumission de job de docking . . . . . . . . . . . . . . . Téléchargement du résultat de docking . . . . . . . . . . iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 5 10 11 12 13 15 19 21 23 27 29 31 33 35 38 39 42 43 44 45 46 47 48 49 51 52 53 53 54 54 55 55 56 56 57 57 58 58 40 41 42 43 44 45 46 47 Fichier log de docking ”dlg” . . . . . . . . . . . . . . . Soumission du projet de docking ProjectZinc1OKE . . Téléchargement du résultat de docking . . . . . . . . . Enregistrement du résultat du job sur la grille de calcul Les fichiers dlg & glg du docking . . . . . . . . . . . . . Les fichiers log de docking et de la grille dlg & glg . . . Téléchargement du résultat des jobs . . . . . . . . . . Les fichiers des jobs soumis en parallèle . . . . . . . . . iv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 59 60 60 60 61 62 63 1 Introduction Par le passé, un grand nombre de médicaments ont été découverts tout simplement grâce à l’identification de principes actifs extraits de substances naturelles historiquement utilisées dans la médecine non-conventionnelle, ou même par hasard, ce qu’on nomme ”sérendipité”. Mais plus le nombre de médicaments connus augmente et plus les probabilités de faire une telle découverte sont faibles. Par la suite, les avancées dans le domaine de la synthèse chimique ont conduit à une démarche de recherche systématique permettant l’élaboration de nouveaux médicaments de plus grande efficacité. La découverte de nouveaux médicaments ”drug discovery” est un processus extrêmement long et fastidieux, 12 à 15 ans peuvent s’écouler entre la découverte de la molécule et la mise à disposition du médicament auprès des patients. Les nouvelles méthodes permettant la découverte de nouveaux médicaments se doivent donc d’innover afin de mettre en évidence des molécules encore inconnues ayant un certain potentiel d’activité sur des cibles biologiques connues [Davis et al,2003]. Les outils mis en place doivent être capables de guider les chimistes médicinaux dans le choix des molécules à cribler et à synthétiser. Les stratégies de criblage virtuel, ou in-silico, sont donc depuis quelques années employées en tant qu’alternative ou de façon complémentaire. Ces techniques sont en général assez faciles à mettre en place, pour un coût bien moindre que les criblages expérimentaux. De plus, l’évolution technologique constante de ces dernières décennies a permis d’accélérer considérablement le temps de calcul nécessaire à la simulation de systèmes complexes ou de bases de données de plusieurs milliers de molécules. Le criblage virtuel est donc aujourd’hui employé dans de nombreux projets, afin de sélectionner, au sein de vastes librairies de molécules, un nombre restreint de composés à cribler expérimentalement. 1.1 Problèmatique L’axe principal de ce travail se situe dans le domaine de bio-informatique. Plus précisement dans la recherche et la découverte de nouveaux médicaments pour les maladies dangereuses comme : HIV, Ebola, fièvre de dengue,..., par le biais de techniques informatiques. Le défi se situe au niveau de la conception de nouveaux médicaments, qui est un processus long et très onéreux, et au niveau du déployement d’un grand nombre de docking sur la grille de calcul. Cependant, les outils existants sont en manque de moyen simple pour fournir des procédures concises pour les utilisateurs réguliers (biologistes, chimistes, etc) afin d’arranger les ressources pour mener un amarrage moléculaires massif. Par conséquent, ces derniers rencontrent plusieurs difficultés et problèmes lors de l’utilisation de ces applications, ce qui entraı̂ne une grande perte de temps et d’argent afin d’accélérer la recherche de nouveaux traitements pour les maladies négligées. 1 1.2 Notre contribution Notre contribution repose sur le développement d’un portail web pour le criblage virtuel en utilisant la grille de calcul pour faciliter la découverte et la recherche de nouveaux médicaments pour les maladies graves et négligées. Nous proposons une interface conviviale et facile à utiliser pour les utilisateurs non-expérimentés (chimistes, biologistes, médecins....) en informatique et en grille de calcul. Afin de favoriser l’intéropérabilité entre le portail web et les services de grille de calcul, nous proposons une architecture qui permettra une analyse et un traitement fiable des requêtes des utilisateurs finaux. 1.3 Plan du mémoire Ce mémoire sera organisé en 4 parties présentant respectivement : l’état de l’art, implémentation & conception, démonstration & résultats, conclusion & perspectives. Dans la première partie, un état de l’art est présenté qui passe en revue le criblage virtuel, le docking, suivie de l’outil AutoDock. Ensuite nous abordons la technologie de grille de calcul, le portail GVSS et les plate-formes WISDOM qui est déployée dans la découverte de nouveaux médicaments et DIRAC. La deuxième partie du mémoire présente l’implémentation du portail, qui se focalisera sur l’architecture proposée, la conception et l’implémentation du portail. L’avant dernière partie porte sur la démonstration du portail muni des résultats obtenus. À la fin, ce mémoire ce termine par une conclusion générale et quelques perspectives. 2 2 État de l’art Aujourd’hui, les projets scientifiques produisent et analysent une quantité d’information sans précédent, ce qui nécessite une puissance de calcul jamais vue auparavant. Les leaders dans ce défi de traitement de données sont les expériences du LHC au CERN, qui accumulent des dizaines de pétaoctets de donnés chaque année. Cependant, il se révèle que d’autres domaines scientifiques s’approchent aussi de ces limites. Par conséquent les utilisateurs devons exploiter les ressources disponibles à travers le monde de manière aisée et facile. Plusieurs travaux existent qui illustrent le développement et le déploiement des applications sur l’infrastructure de la grille de calcul, et qui ont montré une utilisation efficace des ressources de cette dernière. Les utilisateurs sont rarement experts en informatique et en grille de calcul. Pour cette raison ils ont besoin d’un moyen qui facilite l’accès aux ressources de la grille dont ils ont besoins d’un coté, et qui cache la complexité de l’infrastructure sous-jacente de l’autre coté. Dans cette partie, nous allons décrire en détail la technique du criblage virtuel ainsi l’amarrage ”Docking”, le principe de la grille de calcul et son rôle dans la découverte de nouveaux médicaments pour les maladies négilgées et dangereuses. Puis, nous présentons le portail GVSS et la plate-forme WISDOM déployer pour accéder aux services de grille de calcul et DIRAC. • Nomenclature – Ligand, une structure, généralement une petite molécule qui se lie à un site de liaison. – Récepteur, une structure, généralement une protéine qui contient le site de liaison actif. – Site de liaison, zones de protéines actives qui interagissent physiquement avec le ligand pour la formation d’un composé. 2.1 Conception de médicaments in-silico La conception de médicaments assistée par ordinateur emploie la chimie computationnelle pour la découverte, l’amélioration et l’étude de médicaments et molécules biologiquement actives. En effet, l’outil informatique aide la conception de médicaments à des étapes spécifiques du processus : • Dans l’identification des composés potentiellement thérapeutiques, en utilisant le criblage virtuel ”virtual screening”. • Dans le processus d’optimisation de l’affinité et de la sélectivité des molècules potentielles vers les têtes de série ”lead” ou appelés encore prototypes. • Dans le processus d’optimisation du lead de série par rapport aux propriétés pharmacologiques recherchées tout en maintenant une bonne affinité de cette molécule. 3 Toutes ces étapes d’intervention de l’outil informatique sont présentées dans le schéma récapitulatif suivant. Figure 1 – Processus de conception de médicaments in-silico [11] 2.2 Criblage virtuel ”Vitual Screening” L’identification d’une cible pharmaceutique peut se faire par différentes méthodes. Une fois la cible identifiée diagnostiquée, il faut tester un ensemble de molécules candidates sur cette cible, selon un processus qualifié de screening. On distingue deux types de criblage : le criblage virtuel, qui est réalisé in-silico , tout en permettant la réalisation de manière rapide et à moindre coût des prédictions de l’activité des molécules. Et le criblage réel à haut débit, quand à lui il permet de tester rapidement ”in-vitro” l’activité de composés biologiques, et cela est limité par le nombre de composés à tester en un temps raisonnable et par le coût des tests. 2.2.1 Introduction Le terme criblage virtuel ou ”Virtual Screening” regroupe un ensemble de techniques computationnelles ayant pour objectif l’exploration de bases de composés à la recherche de nouvelles molécules. Une analogie souvent utilisée compare ces techniques à des filtres qui permettraient de constituer des ensembles de molécules partageant certaines propriétés et de sélectionner les plus susceptibles d’interagir avec une cible donnée [13]. Aujourd’hui, le criblage virtuel est largement utilisé pour identifier de nouvelles substances bio-active et pour prédire la liaison d’une grande base de donnée de ligands à une cible particulière, dans le but d’identifier les composés les plus prometteurs. Il s’agit d’une méthode qui vise à identifier les petites molécules pour l’interaction avec les sites de protéines cibles afin de faire des analyses et des traitements ultérieures. Plus précisement, le criblage virtuel est défini comme l’évaluation automatique de très grandes banques de composés à l’aide de programmes informatiques, il se référe à une série in-silico, qui est une 4 technique effectuer à base d’ordinateur ou par l’intermédiaire des modèles mathématiques et des simulations informatique, qui aide dans la découverte de nouveaux médicaments et de déterminer de nouveaux composés les plus susceptibles pour se lier à une molécule cible d’une structure 3D connue [2]. Figure 2 – Criblage Virtuel in-silico (http: // serimedis. inserm. fr ) Compte tenu de l’augmentation rapide du nombre de protéines, le criblage virtuel continue à croitre comme une méthode efficace pour la découverte de nouveaux inhibiteurs et de nouveaux médicaments. Il est utilisé dans les premières phases du développement de nouveaux médicaments. Il a pour but de sélectionner au sein de chimiothèques varièes des ensembles réduits de molécules dont le potentiel d’activité envers la cible thérapeutique visée est supérieur à celui des autres molécules [Enyedy Egan, 2008], c-à-d, les molécules qui peuvent influencer l’activité de la protéine cible. Dans ce cas, le criblage a pour objectif l’identification des motifs structuraux essentiels dans la liaison ligand-récepteur, et la discrimination des meilleurs composés au sein de chimiothèques orientées comprenant des molécules appartenant à une même série. Le criblage virtuel est très utile et considéré comme un outil efficace pour accélérer la découverte de nouveaux traitements et la recherche des bibliothèques de petites molécules afin d’identifier les structures qui sont les plus susceptibles de se lier à une cible de médicament, généralement un récepteur de protéine [14]. Il dépend de la quantité d’information disponibles sur la cible d’une maladie particulière. Les techniques de criblage virtuel sont devenues des outils indispensables dans la chimie médicinale qui offrent un moyen d’améliorer la phase de découverte de médicaments. Elles sont utilisées de manière quotidienne aussi bien dans les laboratoires de recherche publics que dans les grands laboratoires pharmaceutiques. 5 2.2.2 Découverte de nouveaux médicaments avec le criblage virtuel Le criblage virtuel est la stratégie in-silico la plus utilisée pour l’identification de composés (”hits”) dans le cadre de la recherche de nouveaux médicaments. Celui-ci fait désormais partie intégrante de la plupart des programmes de recherche de composés bioactifs, que ceux-ci se déroulent en milieu académique ou industriel, car il constitue un complément essentiel au criblage biologique haut-débit. Le criblage virtuel permet l’exploration de grande chimiothèques ( > 106 molécules) à la recherche de composés actifs vis-à-vis d’une cible thérapeutique donnée. Ce processus vise à réduire de façon significative la chimiothèque de départ à une liste limitée de composés jugés les plus prometteurs. Cette approche conduit souvent à une nette amélioration de la ”concentration” de molécules actives pour la cible ”hit-rate”, tandis qu’une sélection aléatoire de molécules de la chimiothèque ne saurait fournir un tel enrichissement. Ainsi, le temps aussi bien que les coûts de l’identification de nouveaux composés peuvent être réduits de façon remarquable. Plus précisément, le recours au criblage in-silico, en préalable à un criblage biologique à plus petite échelle, permet d’ajuster au mieux le nombre de tests expérimentaux ”in-vitro” en fonction des contraintes budgétaires et temporelles. Quand les conditions le permettent, le criblage biologique peut être employé en parallèle au criblage virtuel, afin d’èvaluer l’efficacité de ce dernier et de pouvoir améliorer les paramètres des programmes informatiques utilisés. La pertinence de la molécule employée est la première condition pour le succèes d’un criblage virtuel, bien avant celle des algorithmes utilisés pour la recherche de touches au sein de la molécule. En effet, seule une librairie de composés suffisamment diverse peut garantir une exploration satisfaisante de l’espace chimique, maximisant ainsi les chances de découvrir de nouveaux composés. Par ailleurs, pour éviter de perdre du temps avec des molécules possédant des caractéristiques incompatibles avec celles de composés d’intérêt pharmaceutique, le processus de criblage comporte généralement une étape préliminaire de filtrage. Cette tâche, qui peut être prise en charge par des programmes spécialisés, consiste à exclure les composés toxiques. Ensuite, ne sont retenus que les composés obéissant à des définitions empiriques simples du profil de molécule active. 2.2.3 Les différentes stratégies du criblage virtuel Suivant la nature de l’information expérimentale disponible, on distingue deux approches distinctes pour le criblage virtuel. La première se base sur la structure de la cible, qui est connue sous le nom de ”structure-based virtual screening”, qui rapporte souvent aux algorithmes de docking protéine-ligand. Elle consiste à estimer la complémentarité structurale de chaque molécule criblée avec le site actif considéré. En revanche, ces méthodes sont généralement plus coûteuses en puissance de calcul et leur emploi requiert souvent une expertise plus importante. 6 La seconde, reposant sur la connaissance d’un nombre suffisant d’information concernant une ou plusieurs molécules actives de référence, est appelée ”ligand-based virtual screening”. Cette approche est rapide et relativement simple à mettre en oeuvre, mais son majeur inconvénient est l’interdépendance envers les informations de référence utilisées pour construire le modèle de prédiction d’affinité. Bien que ces deux approches soient surtout utilisées de manière exclusive, leur combinaison lors du criblage permet de maximiser les chances de succès pour identifier de nouvelles touches ”hits”. Dans le cadre de ce travail, nous utilisons l’approche ”structure-based”. 2.2.4 Criblage virtuel à haut débit La simulation de docking moléculaire est une procédé utile pour la prédiction des potentiels interaction des complexes de petite molécule dans des sites de liaison de protéines, ces informations sont indispensables dans la conception de médicaments basée sur la structure (SBDD) ”Structure Based Drug Discovery” [4]. Plusieurs programmes de docking, comme DOCK, GOLD, Autodock, Glide, LigandFit et FlexX, etc se sont montrés utiles dans le pipeline de la découverte in-silico de médicaments. La méthode de base derrière la simulation de docking moléculaire est de générer toutes les conformations possibles d’une molécule de docking et évaluer entre eux l’orientation la plus favorable en tant que mode de liaison de la molécule à l’aide d’une fonction de scoring. Une recherche exhaustive sur toutes les conformations correctes d’un composé est un processus qui consomme beaucoup de temps. Par conséquent, une simulation de docking efficace pour le criblage à grande échelle à haut débit (HTS) consommera de grandes ressources informatiques. Il nécessite quelques Tera-flops par tâche pour effectuer le docking de milliers de composés pour une protéine cible. Cependant, les outils existants manquent de moyen simple pour prévoir des procédures de façon concise pour les utilisateurs régulier afin d’organiser les ressources pour mener un amarrage moléculaires massives. La technologie de la grille commence une nouvelle ère de criblage virtuel en raison de son efficacité ainsi que son rapport coût-efficacité. Le coût des tests in-vitro traditionnelle est généralement très élevé lors du criblage à grande échelle est menée. Le criblage virtuel fournit aux scientifiques un outil efficace pour sélectionner les potentiels composés pour les tests in-vitro. En conséquence, le criblage virtuel à haut débit pourrait bien économiser énorme somme d’argent comparant aux tests in-vitro classique. 2.2.5 Conclusion Nous avons introduit le concept, les stratégies de criblage virtuel. Ce dernier est une approche informatique visant à prédire des propriétés de librairies de molécules. Avec l’essor considérable de données expérimentales publiquement disponibles, cette discipline a enregistré des progrès considérables quant au débit, la qualité et la diversité des prédictions possibles. Un inventaire des applications du criblage ”in-silico” est donné , tout en gardant 7 une attention particulière à des cas concrets d’utilisation ainsi qu’au développements futur. Le criblage virtuel fournit une solution complémentaire pour le criblage virtuel à haut débit ”HTS”, où il comprend des techniques de calcul novatrices. L’avantage du criblage virtuel ”in-silico” est donc de fournir une petite liste de molécules à tester expérimentalement et ainsi réduire les coûts et gagner du temps. On peut aussi explorer rapidement de nombreuses molécules pour se focaliser ensuite, au niveau expérimental, sur les molécules les plus intéressantes. Les difficultés intrinsèques aux techniques à haut débit ainsi que celles rencontrées lors des étapes d’optimisation des molécules chimiques, ont encouragé le développement de nouvelles approches, telles que les techniques de criblage virtuel par docking moléculaire. 8 2.3 2.3.1 Docking Introduction La modélisation de la structure d’un complexe protéine-ligand est très importante pour la compréhension des interactions de liaison entre un composé potentiel ”ligand” et sa cible thérapeutique ”protéine”, et pour la conception de médicaments à base de structure moderne. Le docking ou ”amarrage, arrimage” est une procédé très utile qui vise à prédire l’interaction potentiel de la structure d’un complexe moléculaire à partir des petites molécules dans les sites de liaison de protéine afin d’accélérer la recherche et la découverte de nouveaux médicaments in-silico (c-à-d à l’aide d’ordinateur), ”Le docking in-silico est la détermination de la structure 3D des complexes protéiques à l’échelle atomique, qui permet de mieux comprendre la fonction biologique de ces complexe [1]”. Plus précisement, le docking consiste à trouver la meilleure position d’un ligand (petite molécule) dans le site de liaison d’un récepteur (protéine) de façon à optimiser les interactions avec un récepteur, évaluer les interactions ligand-protéine de façon à pouvoir discriminer entre les positionnement observées expérimentalement et les autres. De façon générale, le docking a pour but de simuler l’interaction entre les molécules in-silico, et les résultats obtenus servent à prédire la structure et les propriétés de nouveaux complexes [3]. Historiquement, les premiers outils de docking obéissaient au principe dit : ”lock-and-key” (principe clef-serrure), selon lequel le ligand qui représente la clef, est complémentaire au niveau géométrique du site actif du récepteur, qui représente la serrure [Yuriev et al., 2011]. Les ligands sont des petites molécules destinées à inhiber l’activité d’une protéine, qui constitue le récepteur. Il permet aussi, de prédire la structure intermoléculaire entre deux molécules en une structure tridimensionnelle 3D, les modes de liaison ou les conformations possibles d’un ligand à un récepteur, et de calculer l’énergie de liaison. La technique de docking prévoit également la résistance de la liaison, l’énergie du complexe, les types de signaux produits et estime l’affinité de liaison entre deux molécules. Elle joue un rôle très important dans l’aide à la décision, afin de déterminer quel ligand candidat interagira le mieux avec un récepteur protéine cible [15]. Le docking protéine-ligand est utilisé pour vérifier la structure, la position et l’orientation d’une protéine quand elle interagit avec les petites molécules comme les ligands. Son but est de prédire et de classer les structures résultant de l’association entre un ligand donné et une protéine cible d’une structure 3D connue. 9 Figure 3 – Docking protéine-ligand Le docking ligand-protéine reste donc la méthode la plus souvent employée, car elle permet une évaluation rapide de bases de milliers, voire de millions de molécules. En principe, un programme de docking doit être capable de générer les modes de liaison attendus pour des ligands dont la position adoptée au sein du site actif est connue dans un temps raisonnable. Pour cela, il est nécessaire que l’algorithme de recherche conformationnelle puisse explorer l’espace conformationnel le plus exhaustivement possible et de façon efficace. Classiquement, on juge la qualité du docking en mesurant le RMSD (Root Mean Square Deviation) sur les atomes entre la pose obtenue en docking, et la pose observée expérimentalement si elle existe. 2.3.2 Approches du docking Les différentes approches du docking se distinguent au niveau de leurs conditions d’application et de la nature des informations qu’elles peuvent fournir. La pertinence du choix d’un programme de docking donné repose en premier lieu sur l’adéquation entre ces caractéristiques et celles du système étudié. L’efficacité de l’algorithme choisi sera par ailleurs un compromis entre la rapidité d’exécution et la précision des résultats. Aussi en fonction du but recherché et du besoin de précision voulu, trois degrés sont en général considérés : rigide (les molécules sont considérées comme rigides), semi-flexible (une molécule rigide et l’autre flexible), flexible (les deux flexibles). Le niveau semi-flexible est souvent appliqué dans le cas protéine-ligand où une des deux molécules (le ligand) de taille moindre est considérée comme flexible et la protéine comme rigide de façon à ne pas trop complexifier le système. 10 Le processus de docking consiste à faire interagir une petite molécule organique avec le récepteur, généralement de nature protéique. La technique de docking comprend 4 étapes principales : 1. Préparer les fichiers pour la protéine. 2. Préparer les fichiers pour le ligand. 3. Préparer les fichiers de paramètres pour la grille. 4. Préparer les fichiers de paramètres pour le docking. Le schéma ci-après montre clairement les étapes de docking. Figure 4 – Étapes du Docking 2.3.3 Principe du docking Le docking moléculaire s’accomplit en deux étapes complémentaires. La première est le Docking, qui consiste à rechercher les conformations du ligand capables à établir des interactions idéales avec le récepteur en utilisant des algorithmes de recherche : algorithme génétique, la méthode de Monte Carlo (qui utilise des procédés aléatoires)... La deuxième dite le ”Scoring”, qui sont des méthodes mathématiques et des fonctions discriminant les poses de docking correctes de celles incorrectes. Ces méthodes sont utilisées pour estimer la puissance d’interaction et l’affinité de liaison et qui permet d’évaluer les conformations par un calcul rapide d’énergie d’interaction des ligands avec un récepteur pour ne retenir que la meilleure. 11 La formule utilisée pour le scoring est la suivante : 4G= 4complexe - 4ligand - 4protéine La figure ci-dessous schématise le principe du docking/scoring, où R symbolise une structure du récepteur. Tandis que, A, B et C représentent les petites molécules. Figure 5 – Illustration de docking/scoring [6] Le docking peut être interprété de manière qualitative par observation de l’entité ligand dans la cavité de la protéine, mais également de manière quantitative par traitement des données provenant des fonctions de scoring. 2.3.4 Outils de Docking A l’heure actuelle, plus de 30 programmes de docking moléculaires (commerciaux ou non) sont disponibles [6]. Les plus fréquemment cités sont respectivement : AutoDock [9], GOLD, FlexX, DOCK et ICM. Ils permettent notamment un criblage rapide de vastes librairies de composés. Ces programmes reposent le plus souvent sur des algorithmes spécifiques (Algorithme génétique, Recuit Simulé...), leur protocole est composé de 2 étapes essentielles Docking/Scoring. Pour accomplir la tâche de docking, les outils d’amarrage moléculaire vont générer une série de poses différentes de liaison au ligand et en utilisant une fonction de notation ”scoring” pour évaluer les affinités de liaison de ligand pour les poses générées afin de déterminer le meilleur mode de liaison. 12
- Xem thêm -