Đăng ký Đăng nhập
Trang chủ Mise en oeuvre de traitement de données analyses de graphes machine learning, ...

Tài liệu Mise en oeuvre de traitement de données analyses de graphes machine learning, et leur automatisation, et web services

.PDF
96
9
143

Mô tả:

UNIVERSITÉ NATIONALE DU VIETNAM, HANOÏ INSTITUT FRANCOPHONE INTERNATIONAL Solibia PAZIMNA Mise en oeuvre de traitement de données - analyses de graphes, machine learning, et leur automatisation, et web services MÉMOIRE DE FIN D’ÉTUDES DU MASTER INFORMATIQUE HANOÏ - 2021 UNIVERSITÉ NATIONALE DU VIETNAM, HANOÏ INSTITUT FRANCOPHONE INTERNATIONAL Solibia PAZIMNA Mise en oeuvre de traitement de données - analyses de graphes, machine learning, et leur automatisation, et web services Spécialité : Systèmes Intelligents et Multimédia Code : Programme pilote MÉMOIRE DE FIN D’ÉTUDES DU MASTER INFORMATIQUE Sous la direction de : M. Jean-Claude Moissinac (Maître de Conférences - Télécom Paris ) HANOÏ - 2021 Attestation sur l’honneur J’atteste sur l’honneur que ce mémoire a été réalisé par moi-même et que les données et les résultats qui y sont présentés sont exacts et n’ont jamais été publiés ailleurs. La source des informations citées dans ce mémoire a bien été précisée. Signature de l’étudiant Solibia PAZIMNA Dédicaces ♥ A mes très chers parents Pour leur soutien, leur amour, leur patience et leur encouragement durant tout mon parcours scolaire. Que DIEU le tout puissant vous préserve, vous accorde santé, bonheur, quiétude de l’esprit et vous protège de tout mal. ♥ A tous mes professeurs C’est une grande fierté pour moi d’être votre étudiant. En témoignage de mon respect et de ma grande affection. ♥ A mes encadrants de stage Je voudrais vous adresser ma gratitude, mes sincères reconnaissances pour tout ce que vous aviez fait pour moi durant mon stage. Votre patience, votre disponibilité et surtout la confiance que vous avez porté à mon égard m’a beaucoup aidé dans l’avancement de mes travaux. ♥ A tous mes amis J’ai l’honneur d’avoir des amis, surtout de la promotion 23 SIM de l’IFI, si gentils, fidèles, sincères et qui n’ont jamais hésité de partager avec moi mes soucis, mon malheur et mon bonheur. Remerciements Je remercie Dieu le tout Puissant, très Miséricordieux, qui m’a donné la santé, le courage et la persévérance durant mon parcours et tout au long de la réalisation de ce travail. C’est avec une certaine émotion et une grande reconnaissance que je remercie l’Université Nationale du Vietnam à travers l’Institut Francophone International et toute son équipe pédagogique, spécialement M. HO Tuong Vinh responsable du master Systèmes Intelligents et Multimédia pour ses conseils et sa disponibilité. Je remercie les professeurs pour les valeurs et méthodes inculquées durant le cursus : la curiosité, le goût du travail, de l’effort, le sens de la persévérance, la volonté de se remettre en question etc. Autant de trésors qui me seront, sans nul doute, utiles toute ma vie. Je tiens à adresser mes profonds remerciements à Télécom Paris, très chaleureusement M. Jean-Claude Moissinac qui m’a beaucoup aidé malgré la situation sanitaire du Covid19 lors de ce stage ; ses conseils et son coaching m’ont permis de cibler et de m’orienter tout au long de ce stage. Il m’a donné envie de persévérer dans ce métier pour lequel il a le plus grand respect, la recherche et l’innovation. Un grand merci à mon père PAZIMNA Akissiwzim Bénoît, à ma mère KPATCHA Pozowa Edith, à ma soeur et à mes frères pour leurs conseils ainsi que pour leur soutien inconditionnel. Je voudrais profiter de cet espace pour leur exprimer toute ma gratitude et ma reconnaissance. Nos vifs remerciements vont également aux membres du Jury, pour l’intérêt et l’attention remarquable qu’ils ont porté à ce projet, en acceptant d’examiner mon travail dans l’objectif de le parfaire à travers leurs modestes remarques, leurs suggestions et leurs corrections. Grâce à vous, j’aborde une nouvelle étape de ma vie avec confiance et dynamisme. Solibia PAZIMNA Résumé Le sujet de ce stage s’inscrit dans le cadre du projet Data&Musée. Nous avons souhaité annoter sémantiquement des textes du domaine culturel français. En effet, l’annotation sémantique ajoute des informations complémentaires à des textes non-structurés, elle peut permettre en particulier d’identifier et de relier les entités du texte avec des données du Web sémantique. Nous avons mis en oeuvre une méthodologie pour construire un système d’annotation de textes pour un vocabulaire spécifique d’un domaine. Les méthodes classiques d’annotation s’intéressant à l’annotation de mentions de personnes, de lieux, d’organisations... et ne couvrent donc pas une bonne partie des termes d’un vocabulaire spécifique. Nous nous sommes donc attachés à mettre au point une méthode qui s’appuie sur des résultats récents en matière de modélisation de textes. La méthode peut se résumer en trois phases à savoir la reconnaissance des mentions d’entités sur notre vocabulaire culturel, recherche dans Wikidata des mentions en fonction de leurs types obtenus à l’étape précédente, enfin nous avons la désambiguïsation pour nous fournir l’entité wikidata exacte correspondante. Pour la reconnaissance des mentions, nous avons opté pour une architecture LST M − C RF + c amemB E RT B B ase qui a fourni une précision moyenne de 93% sur le French Treebank. Au niveau de la désambiguïsation, nous avons retenu la méthode de la représentation contextuelle des entités grâce à laquelle on a eu une précision moyenne de 99% sur les données de test. Pour finir, nous avons mis en place un web service pour rendre exploitable notre travail. Mots clés : annotation sémantique, reconnaissance d’entités nommées, désambiguïsation, wikidata, base Joconde, héritage culturel français, web service. Abstract The subject of this internship is part of the Data & Museum project. We wanted to semantically annotate texts from the French cultural domain. Indeed, semantic annotation adds additional information to unstructured texts, in particular it can identify and link the entities of the text with data from the Semantic Web. We implemented a methodology to build a text annotation system for a domain specific vocabulary. Classical annotation methods are concerned with annotating mentions of people, places, organizations ... and therefore do not cover a good part of the terms of a specific vocabulary. We therefore set out to develop a method that is based on recent results in text modeling. The method can be summed up in three phases : namely the recognition of mentions of entities on our cultural vocabulary, search in Wikidata for mentions according to their types obtained in the previous step, finally we have the disambiguation to provide us with the wikidata entity exact match. For the recognition of mentions, we opted for an LST M −C RF +c amemB E RT B B ase architecture which provided an average accuracy of 93% on the FrenchTreebank. In terms of disambiguation, we have retained the method of the contextual representation of entities thanks to which we had an average accuracy of 99% on the test data. Finally, we have set up a web service to make our work usable. Keywords :semantic annotation, named entities recognition, disambiguation, wikidata, Joconde database, French cultural heritage, web service. Table des matières Liste des figures v Liste des tableaux vi Introduction générale 1 1 Présentation du cadre d’étude et du projet de stage 1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Présentation du cadre d’étude : IFI . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Conditions d’accès et mode de recrutement . . . . . . . . . . . . . . 1.2.3 Organigramme de l’IFI . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.4 Formation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.4.1 Parcours systèmes intelligents et multimédia . . . . . . . . 1.2.4.2 Parcours systèmes et réseaux communicants . . . . . . . . 1.2.4.3 Master en Banque, Finance et Fintech . . . . . . . . . . . . 1.2.4.4 Master en Information - Communication, Spécialité Communication digitale et éditoriale . . . . . . . . . . . . . . . . 1.3 Structure d’accueil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Contexte et problématique du projet . . . . . . . . . . . . . . . . . . . . . . 1.5 Objectifs du stage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 2 3 3 4 4 4 4 5 2 État de l’art 2.1 Introduction . . . . . . . . . . . . . . . . . . . . 2.2 Annotation de corpus [6][7] [8] . . . . . . . . . 2.2.1 Définition . . . . . . . . . . . . . . . . . 2.2.2 Les formats d’annotation . . . . . . . . 2.2.2.1 Etiquetage (POS) . . . . . . . . 2.2.2.2 L’annotation sémantique . . . 2.2.3 Processus et difficultés de l’annotation i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 6 8 8 9 9 9 9 10 10 11 11 TABLE DES MATIÈRES 2.2.4 Annotation sémantique : existant . . . . . . . . . . . . . . . . . . . 2.3 Reconnaissance d’entités nommées [9] [10] [11] . . . . . . . . . . . . . . . 2.3.1 Mesures d’évaluations [10] . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 les CRF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Les Transformers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.4 BERT : Pre-training of Deep Bidirectional Transformers for Language Understanding . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.4.1 Pre-training . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.4.2 Fine-tuning . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.5 RoBERTa : Robustly Optimized BERT-Pretraining Approach . . . . 2.3.5.1 Données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.5.2 Masquage statique et dynamique . . . . . . . . . . . . . . 2.3.5.3 Large Batch Sizes . . . . . . . . . . . . . . . . . . . . . . . . 2.3.5.4 Tokenisation . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.6 CamemBERT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Liaison d’entité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Défis liés à la liaison d’entité . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Graphes de connaissances . . . . . . . . . . . . . . . . . . . . . . . 2.4.3 Faire de la liaison d’entité . . . . . . . . . . . . . . . . . . . . . . . . 2.4.4 RELIC (Representations of Entities Learned in Context) . . . . . . 2.4.5 OpenTapioca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 12 12 13 14 . . . . . . . . . . . . . . . . 17 20 21 22 22 23 23 24 25 26 27 28 29 30 30 32 . . . . . . . . . . . . . . 33 33 35 36 36 36 37 37 39 40 40 40 41 42 42 4 Implémentation et analyse des résultats 4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Reconnaissance des mentions d’entités . . . . . . . . . . . . . . . . . . . . . 4.2.1 Préparation des données . . . . . . . . . . . . . . . . . . . . . . . . . 43 43 43 43 3 Proposition de solution 3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Approche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 La base de données Joconde . . . . . . . . . . . . . 3.3.2 Projet Wikidata Vocabulaires Joconde . . . . . . . . 3.4 Reconnaissance des mentions d’entités . . . . . . . . . . . 3.4.1 Méthode de pré-annotation du corpus . . . . . . . 3.4.2 Modèle de reconnaissance des mentions d’entités 3.5 Recherche des mentions dans le graphe de connaissance 3.6 Désambiguïsation . . . . . . . . . . . . . . . . . . . . . . . 3.6.1 RELIC : données d’entrée . . . . . . . . . . . . . . . 3.6.2 RELIC : Traitements . . . . . . . . . . . . . . . . . . 3.6.3 RELIC : données de sortie . . . . . . . . . . . . . . . 3.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . TABLE DES MATIÈRES 4.2.2 Formation du modèle . . . . . . . . . . . . . . . 4.2.3 Résultat . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Disambiguation . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Préparation des données . . . . . . . . . . . . . 4.3.2 Entrainement du modèle de désambiguïsation 4.3.3 Résultats . . . . . . . . . . . . . . . . . . . . . . . 4.4 Web service . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1 Fonctionnement côté serveur . . . . . . . . . . 4.4.1.1 Vue d’ensemble . . . . . . . . . . . . . . 4.4.1.2 Service . . . . . . . . . . . . . . . . . . . 4.4.2 Fonctionnement côté client . . . . . . . . . . . . 4.4.3 Cas d’utilisation . . . . . . . . . . . . . . . . . . . 4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 50 52 52 54 54 57 58 58 59 60 62 64 Conclusion et perspectives 65 A Quelques fonctions 68 iii Table des figures 1.1 IFI, vue satellite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Organigramme IFI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 4 2.1 Formats d’annotation [7] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Architecture globale de "Transformer" [14] . . . . . . . . . . . . . . . . . . . 2.3 Scaled Dot-Product Attention Multi-Head Attention consists of several attention layers running in parallel [14] . . . . . . . . . . . . . . . . . . . . . 2.4 BERT input representation [13] . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Procédures générales de pre-training et fine-tuning pour BERT.) [13] . . . 2.6 BERT Pre-training and Fine-Tuning Tasks ) [13] . . . . . . . . . . . . . . . . 2.7 Masked Language Model (MLM) [13] . . . . . . . . . . . . . . . . . . . . . . 2.8 NSP [13] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9 CoNLL-2003 Named Entity Recognition results avec BERT [13] . . . . . . . 2.10 Comparaison entre statique et dynamique masquage pour B E RTB ASE [26] 2.11 Perplexité sur les données d’entraînement bloquées (ppl) et la précision des ensembles de développement pour les modèles de base entraînés sur BOOKCORPUS et WIKIPEDIA avec différentes tailles de lots (bsz) [26] . . . 2.12 Les résultats du développement défini pour RoBERTa étant donné que nous effectuons un pré-entraînement sur plus de données (16 Go → 160 Go de texte) et un pré-entraînement plus long (100K → 300K → 500K étapes) [26] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.13 Résultats de Camembert sur les données de test du corpus FTB-NE [10] . 2.14 Tâche de entity linking [17] . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.15 EL pipeline [17] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.16 Résultat de EL RELIC [20] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.17 Résultat de EL OpenTapioca [18] . . . . . . . . . . . . . . . . . . . . . . . . . 10 15 16 19 19 19 20 21 22 23 24 24 26 26 29 30 31 3.1 Diagramme représentant la solution proposée . . . . . . . . . . . . . . . . . 34 3.2 Expressions lematisé et stocké par clé . . . . . . . . . . . . . . . . . . . . . . 38 3.3 Exemple IOB-annotation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 iv TABLE DES FIGURES 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 4.13 4.14 4.15 4.16 4.17 4.18 4.19 Exemple de la structure de wiki40b . . . . . . . . . . . . . . . . . . . . Données totales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Données d’entraînement . . . . . . . . . . . . . . . . . . . . . . . . . . Données de validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . Données de test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Évolution du score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Évolution de la perte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Évaluation du modèle sur les données de validation . . . . . . . . . . Évaluation du modèle sur les données de test . . . . . . . . . . . . . . Exemple de dump des entités wikidata du vocabulaire joconde . . . . Exemple de contextes d’entités . . . . . . . . . . . . . . . . . . . . . . . Évolution du score sur les données d’entrainement et de validation . Évolution de la perte sur les données d’entrainement et de validation Résultats des métriques sur les données de validations . . . . . . . . . Résultats des métriques sur les données de test . . . . . . . . . . . . . Schéma Web service [23] . . . . . . . . . . . . . . . . . . . . . . . . . . Interface principale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Présentation du résultat d’annotation brute . . . . . . . . . . . . . . . Présentation du résultat d’annotation json . . . . . . . . . . . . . . . . v . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 46 47 48 49 50 51 51 52 53 53 55 56 56 57 58 61 61 62 Liste des tableaux 3.1 Ground truth (14/7/2020). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4.1 Paramètres du modèle de reconnaissance de mentions. . . . . . . . . . . . 50 4.2 Paramètres du modèle de désambiguïsation. . . . . . . . . . . . . . . . . . . 54 vi Liste des sigles et acronymes EL Entity Linking NLP Natural Language Processing NSP Next Sentence Prediction NER Named Entity Recognition Introduction Générale De nos jours, de grands progrès ont été réalisés dans le domaine dans le traitement automatique du langage naturel 1 qui est un domaine multidisciplinaire impliquant la linguistique, l’informatique et l’intelligence artificielle, visant à créer des outils de traitement de la langue naturelle pour diverses applications. Ces progrès ont beaucoup bénéficié des méthodes d’apprentissage en profondeur (le deep learning), basées principalement sur les réseaux de neurones, de l’augmentation de la puissance de calcul des ordinateurs actuels et aussi de la disponibilité d’une grande quantité de données. Plusieurs domaines tels que les ressources humaines, le droit, la relation client, la santé, la culture et pleins d’autres s’appuient sur les techniques de traitement automatique du langage naturel afin de réduire l’erreur humaine et de fournir des résultats plus efficaces. Le stage a été réalisé dans le cadre du projet Data&Musée, 2 dont le but était la collecte et l’exploitation de données concernant des musées de France. Ce travail a porté sur l’annotation sémantique de textes de ce domaine, par exemple des descriptions d’expositions. L’annotation sémantique ajoute des informations complémentaires à des textes non-structurés, elle peut permettre en particulier d’identifier et de relier les entités du texte avec des données du Web sémantique. Ces annotations peuvent par exemple contribuer à une mise en valeur des musées et expositions françaises. La mise à disposition des vocabulaires scientifiques servant à l’interrogation et à l’alimentation des divers champs de la base Joconde par le service des Musées de France, constitue une avancée importante pour la mise en valeur des musées et expositions français. Grâce à ces vocabulaires, nous avons accès à un certain nombre de termes et expressions liés à l’héritage culturel français. L’objectif de ce travail est de mettre en place un outil permettant de reconnaître et lier automatiquement dans un corpus textuel en français, les différents types du vocabulaire Joconde. Dans les lignes qui suivent dans ce document, je vais vous présenter le travail effectué tout au long de ce stage à travers les sections suivantes : l’état de l’art des méthodes, les différents choix des méthodes, l’implémentation des méthodes, l’évaluation des modèles, puis un bref résumé des résultats obtenus et les perspectives à venir pour ce travail. 1. https://fr.wikipedia.org/wiki/Traitement_automatique_des_langues 2. http://datamusee.fr 1 Chapitre 1 Présentation du cadre d’étude et du projet de stage 1.1 Introduction Dans ce chapitre, nous allons présenter d’une manière générale, le cadre d’étude (IFI : Institut Francophone International), la structure d’accueil pour ce stage (Télécom Paris, au sein de l’Institut Mines-Télécom, grande école publique des ministères de l’industrie et des communications électroniques) et le projet Data&Musée. 1.2 Présentation du cadre d’étude : IFI L’Institut Francophone International (IFI) a été créé en 1993 sur la base du développement de l’Institut de la Francophonie pour l’Informatique, et de l’intégration du Pôle Universitaire Français à Hanoi, fondé en 2006. Il se situe dans l’enceinte de l’Université Nationale du Vietnam (Hanoi). Officiellement nommé "Institut Francophone International" à compter du 18 novembre 2014, l’IFI est un organisme international de recherche et de formation de haute qualité, rattaché à l’Université Nationale du Vietnam, Hanoi. Il a pour mission d’apporter un appui logistique et technique en informatique aux différentes entreprises, laboratoires de recherche etc. Il offre aussi un cadre de formation en informatique. Cette offre de formation est constituée de deux filières à savoir : Systèmes Intelligents et Multimédia (SIM) et Réseau et Systèmes Communicants (RSC). Depuis sa création en 2009, l’IFI forme ses étudiants en vue de l’obtention d’un double diplôme de master recherche . La figure 1.1 présente une vue satellite de l’Institut Francophone International. 2 CHAPITRE 1. PRÉSENTATION DU CADRE D’ÉTUDE ET DU PROJET DE STAGE F IGURE 1.1 – IFI, vue satellite 1.2.1 Objectifs Etant une école de renommée en informatique, l’IFI a pour principaux objectifs de : — doter les étudiants de connaissances en intelligence artificielle, machine learning, deep learning, traitement d’images et de vidéos, vision par ordinateur, modélisation et simulation des systèmes complexes, fouille de données, etc ; — former les étudiants aux méthodes et à la pensée de la recherche scientifique, pour être capables de résoudre indépendamment les problèmes techniques. 1.2.2 Conditions d’accès et mode de recrutement — Conditions d’accès : Licence (BAC +3) en informatique ou dans une spécialité proche (Mathématiques, Physique). Langue française : au moins DELF B2 (selon le Cadre européen commun de référence pour les langues) ou équivalent (TCF 400. . . ), sauf les candidats provenant de pays où le français est la langue principale ou officielle, et pour ceux qui ont déjà un diplôme universitaire de la langue Française. — Mode de recrutement : évaluation du dossier et entretien de recrutement. 3 CHAPITRE 1. PRÉSENTATION DU CADRE D’ÉTUDE ET DU PROJET DE STAGE 1.2.3 Organigramme de l’IFI 1 L’Institut Francophone International est constitué d’une direction et de divisions. La direction s’appuie sur une Direction, un conseil scientifique, des services, des laboratoires et des centres comme l’indique plus clairement l’organigramme 1.2 ci-dessous. F IGURE 1.2 – Organigramme IFI 1.2.4 Formation L’IFI offre, pour sa formation, quatre filières au choix : systèmes intelligents et multimédia, systèmes et réseaux communicants, master en banque finance et fintech , master en information - communication, spécialité communication digitale et éditoriale. 1.2.4.1 Parcours systèmes intelligents et multimédia Le master informatique : option systèmes intelligents et multimédia combine des connaissances issues de différents domaines d’études en Informatique (modélisation et simulation, intelligence artificielle, fouille de données, interaction homme-machine, génie logiciel, etc.). Le programme vise à concevoir et à construire des systèmes intelligents d’aide à la décision basés sur l’exploitation des informations multimédia. Le programme s’oriente vers l’amélioration du potentiel scientifique, intellectuel et de la vision des étudiants en réponse aux innovations croissantes dans le domaine des sciences et de la technologie, en particulier dans la révolution industrielle 4.0 [1]. 1.2.4.2 Parcours systèmes et réseaux communicants Le master informatique : option réseaux systèmes communicants combine des connaissances issues de différents domaines d’études (réseaux avancés stockage, cloud 1. http://www.ifi.edu.vn/fr/about/Organigramme.html 4 CHAPITRE 1. PRÉSENTATION DU CADRE D’ÉTUDE ET DU PROJET DE STAGE et virtualisation, sécurité des réseaux, réseaux ad-hoc avances, réseaux sans fil et mobile, administration des systèmes et des réseaux, etc.). Le programme vise à concevoir et à construire des plateformes de communication durable qui assurent un service transparent et permanent. Le programme s’oriente vers l’amélioration du potentiel scientifique, intellectuel et de la vision des étudiants en réponse aux innovations constantes dans le domaine des sciences et de la technologie, en particulier dans la révolution industrielle 4.0 [2]. 1.2.4.3 Master en Banque, Finance et Fintech Ce parcours a pour objectifs de fournir aux étudiants des connaissances approfondies et les plus récentes dans le secteur bancaire et financier à l’ère d’industrie 4.0. Le programme Fintech en partenariat entre IFI et EM Normandie est le premier mis en œuvre au Vietnam et le deuxième en Asie. Il bénéficie de la participation d’enseignants et experts internationaux ayant une grande expérience de formation et de conseil provenant des centres mondiaux en marché financier et en Fintech [3]. 1.2.4.4 Master en Information - Communication, Spécialité Communication digitale et éditoriale Le programme de formation de master information et communication, spécialité communication digitale et éditoriale en cotutelle de l’Université de Toulon et de l’Institut Francophone International (Université Nationale du Vietnam à Hanoi) financé par l’Agence Universitaire de la Francophonie (AUF) a pour objectif de former des spécialistes en communication en se fondant sur des techniques informatiques et d’ : - aider les diplômés en français et en Sciences humaines et sociales souhaitant travailler dans le domaine de la communication à acquérir des connaissances complémentaires de communication digitale et éditoriale ainsi que des techniques informatiques utilisées dans ce domaine ; - aider les diplômés en Sciences et en Sciences technologiques à acquérir des connaissances complémentaires de communication ; - aider les diplômés en Journalisme-Éditation, les correspondants et les éditeurs à moderniser leur procédure professionnelle [4]. 1.3 Structure d’accueil Télécom Paris 2 anciennement Télécom ParisTech, École nationale supérieure des télécommunications et École supérieure de télégraphie, est l’une des 205 écoles d’ingénieurs françaises accréditées au 1er septembre 2019 à délivrer un diplôme d’ingénieur. Elle est aussi un centre de recherche de référence dans les technologies du numérique. 2. https://fr.wikipedia.org/wiki/Télécom_Paris 5
- Xem thêm -

Tài liệu liên quan