UNIVERSITÉ NATIONALE DU VIETNAM À HANOÏ
INSTITUT FRANCOPHONE INTERNATIONAL
Mémoire de stage de Master 2
Option : Systèmes Intelligents et Multimédia (SIM)
Promotion : XXII
Implémentation et test de méthodes de
Deep Learning en télédétection pour
détecter des palmiers rafias en milieu
naturel et sur différents types d’images
(satellites, aériennes, drones)
KINDA Zakaria
Encadrant :
M. BORNE Frédéric
Ph.D, Ingénieur de recherche CIRAD
Année académique 2018-2019
Résumé
Les Rafias sont des plantes situées dans des forêts denses, notamment dans les zones
marécageuses où les couronnes sont imbriquées les unes dans les autres. On les trouve
principalement dans les pays de l’Afrique Centrale et de l’Ouest avec des rendements
économiques très importants. Compte tenu de cette importance économique, il est nécessaire de connaı̂tre le nombre de Rafias se trouvant dans ces forêts denses. Récemment
plusieurs travaux ont été réalisés en télédétection pour la détection des objets en utilisant
des images réelle et de synthèse. La télédétection serait donc un outil pouvant intervenir
dans la détection des palmiers Rafias. Les méthodes actuelles de détection d’objets dans
des images réelles et de synthèse sont basées principalement sur l’apprentissage profond
utilisant les fenêtres glissantes. À cet effet plusieurs réseaux tels-que le réseau de neurones
convolutionnels (CNN), le Fast-RCNN, le Faster R-CNN, le Mask R-CNN, etc ont atteint des performances de pointe sur le traitement des données spatiales, notamment des
images. Ainsi, le Faster-RCNN est un réseau largement utilisé pour la détection des objets dans une image. Il est utilisé sur des images réelles, mais également sur les images de
synthèse pour la détection des fruits, de fleurs, des plantes, etc. avec des F-Mesures allant
jusqu’à 93%. Dans cette étude, il était question d’évaluer l’intérêt des images de synthèse
pour entrainer un réseau destiné à traiter des images réelles. Les expérimentations ont été
effectuées sur des images présentant des caractéristiques contrôlées (résolution de l’image,
résolution métrique, ombrage, direction de la lumière, etc). Pour ce faire, nous avons utilisé le modèle VGG16 déjà pré-entraı̂nés avec le jeu de données PASCALVOC 2007. Les
résultats expérimentaux montrent que l’apprentissage profond peut faire un grand bond
en avant sur la détection des plantes en forêt dense en utilisant des images de synthèse.
Mots clés : Rafia, Apprentissage profond, télédétection, image de synthèse, réseau de
neurone convolutionnel (CNN), Faster R-CNN.
i
Abstract
Rafias are plants located in dense forests, especially in swampy areas where the crowns are
intertwined. They are mainly found in Central and West African countries with very high
economic returns. Given this economic importance, it is necessary to know the number
of raffia trees in these dense forests. Recently, several works have been carried out in remote sensing for the detection of objects using real and synthetic images. Remote sensing
would therefore be a tool that could be used to detect raffia palm trees. Current methods
of detecting objects in real and synthetic images are based mainly on deep learning using
sliding windows. To this end, several networks such as the Convolutional Neural Network
(CNN), Fast-RCNNN, Faster R-CNN, Mask R-CNN, etc. have achieved advanced performance in spatial data processing, particularly images. Thus, the Faster-RCNNN is a
widely used network for detecting objects in an image. It is used on real images, but also
on computer-generated images for the detection of fruits, flowers, plants, etc. with F-Score
up to 93%. In this study, it was a question of evaluating the interest of synthetic images
to train a network designed to process real images. The experiments were carried out
on images with controlled characteristics (image resolution, metric resolution, shading,
light direction, etc.). To do this, we used the VGG16 model already pre-trained with the
PASCALVOC 2007 dataset. Experimental results show that deep learning can take a big
leap forward in plant detection in dense forests using synthetic images.
Keywords :Rafia, Deep Learning, remote sensing, Synthetic image, convolutional neural
network (CNN), Faster R-CNN.
ii
Avant-propos
Ce travail a bénéficié d’une aide de l’État gérée par l’Agence Nationale de la Recherche au
titre du programme d’Investissements d’Avenir portant la référence ANR-16-CONV-0004.
Cette étude s’inscrit dans le cadre des stages financés par l’Institut de Convergence de
l’agriculture numérique DigitAg basé à Montpellier et avec des antennes satellites à Rennes
et Toulouse.
L’objectif est de construire un socle de connaissances qui favorise le développement de
l’agriculture numérique en France et au Sud. L’Institut de Convergence DigitAg structure
ses actions autour de six axes de recherche et huit challenges.
iii
Remerciements
« N’a pas remercié Allah celui qui ne remercie pas les gens » (Hadı̂th)
Pour cela, je voudrais très sincèrement adresser toute ma gratitude et ma reconnaissance
à mes encadrants, M. Frédéric Borne et Mme Gaëlle Viennois, pour leur patience, pour
leur disponibilité et surtout pour la confiance qu’ils ont portée à mon égard. Leurs judicieux conseils et encouragements ont contribué au bon déroulement de mon stage et à
l’aboutissement de ces résultats.
Je tiens également à remercier M. Philippe Borianne pour ses remarques pertinentes, sa
disponibilité, ses encouragements et toutes les discussions que nous avons pu avoir sur le
sujet.
Mes remerciements vont à l’endroit de M. Marc Jaeger pour l’acquisition des données et
pour ses différents conseils et remarques
Je voudrais remercier l’Agence Nationale de la Recherche (ANR) pour le financement de
ce projet.
Je désire également remercier le corps enseignant de l’Institut Francophone International
(IFI), qui m’a fourni les outils nécessaires à la réussite de mes études universitaires
Mes remerciements vont à l’endroit de tout le personnel et les étudiants de l’UMR AMAP
pour les échanges enrichissants, tant humainement que scientifiquement.
Enfin, je tiens à exprimer ma profonde gratitude à mes parents, à toute ma famille et aussi
à tous ceux et celles qui m’ont apporté leur soutien et leurs encouragements indéfectibles
tout au long de mes années de Master.
iv
Table des matières
Table des figures
vii
Liste des tableaux
viii
INTRODUCTION
1
Chapitre 1 Analyse du contexte
1.1 Contexte de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Objectif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
3
4
5
Chapitre 2 État de l’art
2.1 Approche du Machine Learning ou approche classique . . . . . . . . . . .
2.2 Approche du Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . .
7
8
9
Chapitre 3 Données et Méthodes
3.1 Données . . . . . . . . . . . . . . . . . . .
3.1.1 Méthode d’acquisition des données
3.1.2 Présentation des images du masque
3.1.3 Pré-traitement de données . . . . .
3.2 Méthodes . . . . . . . . . . . . . . . . . .
3.2.1 Faster R-CNN . . . . . . . . . . . .
3.2.2 Architecture du Faster R-CNN . .
3.2.3 Fonctionnement du Faster R-CNN .
3.2.4 Transfer learning . . . . . . . . . .
3.2.5 Méthode d’entraı̂nement du réseau
3.2.6 Méthode de validation du réseau .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
12
13
13
18
19
20
20
20
21
21
22
22
Chapitre 4 Expérimentations et résultats
24
4.1 Expérimentations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.1.1 Environnement de travail . . . . . . . . . . . . . . . . . . . . . . . . 25
v
4.2
4.1.2 Création des fichiers d’annotations . . . . . . . . . . . . . . . . .
4.1.3 Entraı̂nement du réseau . . . . . . . . . . . . . . . . . . . . . . .
4.1.4 Validation du réseau . . . . . . . . . . . . . . . . . . . . . . . . .
Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1 vérification de l’indice spéculaire . . . . . . . . . . . . . . . . . . .
4.2.2 Évaluer l’influence d’une deuxième classe sur la première (troisième
expérimentation) . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.3 Transposition à l’image réelle (Quatrième expérimentation) . . . .
Chapitre 5 Discussion et bilan
5.1 Discussion . . . . . . . . . . . .
5.1.1 Entraı̂nement du réseau
5.1.2 Aspect spéculaire . . . .
5.1.3 Choix du fichier de poids
5.1.4 Matrice de confusion . .
5.1.5 Les annotations . . . . .
5.2 Bilan . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
26
27
27
27
. 33
. 36
.
.
.
.
.
.
.
37
38
38
38
39
39
40
41
Chapitre 6 Conclusion et perspectives
42
6.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
ANNEXE
45
vi
Table des figures
1.1
1.2
Photographie d’un Rafia hookeri . . . . . . . . . . . . . . . . . . . . . . . .
Image aérienne Rafia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1
Popularité des méthodes en % . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.1
3.2
3.3
3.4
3.5
3.6
Image de synthèse de Rafias prenant en compte une forte réflexion spéculaire
Image de synthèse avec des Rafias présentant une réflectance plus faible . .
Image drone de Rafias . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Image de synthèse et son masque . . . . . . . . . . . . . . . . . . . . . . .
Masque d’image annotée . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Architecture Faster R-CNN [26] . . . . . . . . . . . . . . . . . . . . . . . .
14
14
18
19
19
20
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
Test d’annotations sur l’image du masque . . .
Fonction de perte globale . . . . . . . . . . . . .
Fonctions de perte RPN et CLS . . . . . . . . .
Courbe de F-Mesure expérimentation 1 . . . . .
Matrice de confusion à une classe . . . . . . . .
Résultats de validation avec des Rafias en blanc
Matrice de confusion Rafias en couleur . . . . .
résultats de validation avec des Rafias en vert .
Courbe de F-Mesure pour la classe Rafia . . . .
Matrice de confusion pour la classe Rafia . . . .
Courbe de F-Mesure de Rafia et du cocotier . .
Confusion à 2 classes plus Background . . . . .
Résultat de validation sur une image réelle . . .
26
28
29
30
30
31
32
32
33
34
35
35
36
5.1
Résultats en sortie de validation . . . . . . . . . . . . . . . . . . . . . . . . 40
vii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
5
Liste des tableaux
4.1
4.2
Liste des images d’entraı̂nement . . . . . . . . . . . . . . . . . . . . . . . . 27
Liste des images de validation . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.1
Bilan de résultats de expérimentations . . . . . . . . . . . . . . . . . . . . 41
viii
Nomenclature
CNN : Convolutional Neural Network
VP : Vrais Positifs
FN : Faux Négatifs
FP : Faux Positif
RPN : Region Proposal Network
CUDNN : Deep Neural Network Library
CLS : Box-Class Layer
CIRAD : Centre de Coopération Internationale de Recherche Agronomique pour le Développement
CNRS : Centre National de la Recherche Scientifique
ix
INTRODUCTION
Dans le cadre de notre formation en « Systèmes intelligents et multimédias» pour l’obtention du diplôme de Master 2, il est demandé d’effectuer cinq à six mois de stage dans
un laboratoire ou une entreprise de premier plan. C’est dans ce cadre que j’ai été reçu à
l’UMR AMAP (Unité Mixte de Recherche botAnique et Modélisation de l’Architecture
des Plantes et des végétations) dans les locaux du CIRAD (Centre International de Recherche Agronomique pour le Développement) de Montpellier. L’UMR AMAP est une
unité de pointe interdisciplinaire qui travaille à l’acquisition de connaissances fondamentales sur les plantes et les végétations dans le but de prévoir la réponse des écosystèmes
aux forçages environnementaux, en termes de distribution/conservation des espèces et de
la biodiversité, production des cultures agronomiques, stockage du carbone dans la biomasse végétale, protection de l’environnement et des services écosystémiques. Ces travaux
s’intéressent aux végétations méditerranéennes, tempérées et tropicales essentiellement. Ils
croisent les champs disciplinaires de la botanique (systématique et structurale), l’écologie
de la végétation, l’agronomie et la foresterie avec ceux de l’informatique, des mathématiques et des statistiques appliquées. Les recherches de l’unité s’articulent autour de 3
axes transversaux, la plupart des chercheurs de l’unité contribuant à plusieurs axes :
— Biodiversité végétale, actuelle et passée :
L’objectif est de comprendre les processus qui sous-tendent la diversité des objets biologiques, actuels et passés.
— Biomasse et production des plantes et des végétations :
L’objectif est de comprendre les stratégies d’allocation des ressources et de répartition de
la biomasse dans les plantes et les végétations.
— Modélisation du monde végétal :
Cet axe s’intéresse au développement de méthodes d’étude et de modélisation des systèmes
végétaux complexes.
1
Chapitre 1
Analyse du contexte
Ce premier chapitre consiste à présenter une analyse exploratoire de mon sujet d’étude.
Il présente les éléments nécessaires à la compréhension du contexte de l’étude, de la
problématique ainsi que l’objectif du sujet.
1.1
Contexte de l’étude
Les produits naturels de la forêt ont une importance capitale pour la population mondiale,
notamment celle de l’Afrique. Ces produits contribuent fortement à réduire la pauvreté
et à accroı̂tre la production alimentaire. Parmi ces produits naturels de la forêt, nous
avons les palmiers, particulièrement, le Rafia hookeri qui est l’un des palmiers les plus
utiles économiquement. Au cours de la dernière décennie, le Rafia a donc suscité beaucoup
d’intérêt à travers son apport économique. Le Rafia possède des fibres très solides appelées
piassavas utilisées pour la fabrication de, cordes grossières, de ceintures,de brosses [32].
La fibre est également exportée pour la production des balais, des tapis des chapeaux,
des sacs et des costumes. Les feuilles de Rafia sont parmi les plus grandes des palmiers
d’Afrique. En plus des fibres, ces feuilles produisent de la sève (vin de palme) qui constitue
une boisson très populaire en Afrique et qui est également exportée hors du continent. La
sève produit des nutriments utiles qui pourraient jouer un rôle actif dans la physiologie
et la santé humaines [22].
Les Rafias sont localisés dans les forêts marécageuses notamment dans les pays de l’Afrique
de l’ouest (Guinée, Nigeria), de l’Afrique centrale (Congo, Cameroun, Gabon, etc.). Ces
Rafias se regroupent dans les marais d’eau douce et au bord des rivières, donc dans
les zones marécageuses avec des couronnes imbriquées les unes dans les autres, donc
difficilement dénombrables. À cet effet, les satellites d’observation de la Terre, les avions
et les drones (images aériennes) s’avèrent un outil tout à fait approprié pour l’étude de la
biosphère terrestre, à toutes les échelles de temps et d’espace, même s’ils ne permettent pas
d’observer directement tous les paramètres relatifs à la végétation, comme la hauteur des
arbres, leur volume, la structure verticale des couverts ou encore la végétation qui pousse
sous les arbres d’une forêt. Ainsi la télédétection est un outil pouvant être utilisé pour la
détection du Rafia en milieu naturel. Dans le cadre de ce travail, l’enjeux principal est de
compter les Rafias à l’échelle d’un paysage. La figure 1.1 présente une photographie de
Rafia hookeri en milieu naturel.
3
Figure 1.1 – Photographie d’un Rafia hookeri
1.2
Problématique
Grâce aux nouvelles techniques de recherche d’informations notamment le Machine Learning et le Deep Learning sur les images aériennes, il est possible d’extraire des informations sur des grandes masses de données. Ces techniques sont utilisées sur des grandes
bases de données issues des séries temporelles d’images, et plus encore pour l’extraction
d’informations (extraction des objets) à l’intérieur des images. Sur des images de forêt
naturelle tropicale il est cependant souvent difficile d’extraire des informations en utilisant
ces nouvelles techniques. Les études menées par des chercheurs d’AMAP depuis 2015 sur
le dénombrement des Rafias l’illustrent. Les travaux de 2015 [19] ont utilisé les méthodes
d’apprentissage classiques (machine learning) pour la classification des Rafias en milieu
naturel avec des résultats variant entre 44% et 70%. En 2018 des nouvelles études sont
menées utilisant un réseau de neurone convolutionnel (deep learning) [31] sur des images
de télédétection pour le dénombrement des Rafias. Les résultats obtenus donnent un taux
de bonne prédiction de 63%, meilleur qu’avec les méthodes de Machine Learning mais un
taux largement en dessous de ceux obtenus dans les usages classiques du Deep Learning,
4
ce qui montre que la méthode est pour l’instant moins efficace sur les données utilisées.
Dans ces études, les données utilisées pour le dénombrement sont des ortho-images RVB
issues de l’acquisition par drone associées à des annotations expertes. Les chercheurs ont
établi que les résultats faibles du réseau sont dus au fait que l’annotation des Rafias est
très difficile à cause des couronnes imbriquées les unes dans les autres. Aussi, en observant
la figure 1.2 (image aérienne) nous constatons qu’il est presque impossible pour l’humain
de compter le nombre de Rafias sur cette image. Face à cette situation il est donc impératif
de mettre en place de nouvelles méthodes permettant de dénombrer les Rafias en milieu
naturel.
Figure 1.2 – Image aérienne Rafia
1.3
Objectif
Les résultats obtenus lors de cette première expérience sur la détection du Rafia par
Deep Learning ont montré la difficulté d’annoter les Rafias sur les images réelles. Pour
atteindre leur objectif, les auteurs [31] se sont orientés vers une méthode de génération des
images de synthèse (image RVB) pour le dénombrement des Rafias en milieu naturel. En
effet, il s’agit d’évaluer l’intérêt des images de synthèse pour la classification des images
5
naturelles. Pour ce faire, dans le cadre de notre étude, nous allons identifier un réseau
de neurones pour effecteur des entraı̂nements sur ces images de synthèse. Par la suite
l’objectif de notre travail serait d’effecteur une transposition de le méthode mise en place
pour la reconnaissance du Rafias sur les images réelles (images aérienne).
6
Chapitre 2
État de l’art
L’objectif de ce chapitre est de considérer les travaux réalisés en Deep Learning et en
Machine Learning sur la détection des objets dans des images de télédétection et de
comparer ces approches.
7
2.1
Approche du Machine Learning ou approche classique
Les recherches antérieures sur la détection de palmiers ou de couronnes d’arbres imbriquées ont généralement été basées sur les méthodes traditionnelles dans le domaine de la
vision par ordinateur. En plus des palmiers, ces méthodes sont utilisées en général pour
la détection d’objets dans une image. Les auteurs Mandjo BORE et al.[19] ont mené une
étude sur la cartographie par télédétection des peuplements de Rafias en forêt dense à
partir des données satellitaires, en utilisant les algorithmes du plus proche voisin (KNN)
combinés à l’analyse en composante principale (ACP). Le problème soulevé par cette
étude est la difficulté à détecter ces types de palmier en forêt dense. Les résultats de
leur approche sont compris entre 44% et 68%. Malek et al. [17] ont utilisé une transformation des caractéristiques invariante à l’échelle (SIFT) et un classificateur supervisé de
machines d’apprentissage extrême pour détecter les palmiers à partir partir d’images de
drones (véhicules aériens sans pilote (UAV)). Srestasathiern et al. [30] utilisent le calcul de
semi-variogrammes et la suppression non-maximale pour la détection de palmiers à partir
d’images satellites multispectrales à haute résolution. Ils obtiennent des résultats variant
entre 89% et 96%. Malgré ces résultats, ce travail n’intervient pas dans le carde de notre
étude, car elle a été appliqué sur des plantations de palmiers où les couronnes ne sont pas
imbriquées. Yiran Wang et al.[33] ont réalisé des travaux sur la détection et le dénombrement des palmiers à huile dans des plantations de Malaisie sur des images de drone en
utilisant les fonctions d’histogramme de gradient orienté (HOG) [12] et du classificateur
machine à vecteur de support (SVM). L’analyse de composantes principale (ACP) a été
utilisée par les auteurs KOMBA Prune et al[2] pour la classification des cocotiers sur des
images satellitaires, avec un résultats de 56%. Manandhar et al[18] ont mené des études
sur une plantation de palmiers en utilisant un algorithme local de détection maximale sur
des images drone normalisés pour détecter les palmiers et un Support Vector Machine
(SVM) pour la classification. R. Saini et al.[28] ont étudié la classification des cultures à
l’aide d’imagerie sentinel-2 à date unique en utilisant les méthodes Random Forest (RF) et
Support Vector Machine (SVM). Ils ont montré dans leur étude la meilleure efficacité de
RF (84%) par rapport au SVM (81%) pour classifier les cultures sur les images satellites
Ces études antérieures sur la détection des arbres notamment des palmiers [33, 18, 17]
ont donné de bons résultats (96%)[17], car ces arbres sont localisés dans des zones d’études moins denses où les couronnes ne se chevauchent pas. Toutefois, la performance
de certaines de ces méthodes se détériorent fortement lors de la détection des palmiers
et autres plantes dans certaines régions de notre zone d’étude, surtout dans les milieux
naturels où les couronnes sont imbriquées les unes dans les autres [2, 19]. Aussi, notre
8
étude étant dans une zone naturelle où la forêt est dense, nous allons mener une étude
utilisant l’approche du Deep Learning.
2.2
Approche du Deep Learning
Le "Deep Learning" signifie "Apprentissage Profond". Il est considéré comme un sousdomaine du Machine Learning permettant d’apprendre de manière automatique. Il s’agit
d’une approche en pleine expansion ces dernières années, notamment sur la détection de
plante dans une image. L’un des pionniers de cette approche est Yann Lecun qui a effectué
plusieurs études dans ce domaine [14]. De ce fait plusieurs articles ont été publié sur la
détection des objets en utilisant l’approche du Deep Learning.
Dans l’article [15] les auteurs Weijia Li et al ont mené une étude sur la détection des palmiers à huile sur des images de télédétection à très haute résolution spatiale en Malaisie
en utilisant le Deep Learnig. Ces études ont été réalisé sur des plantations de palmiers à
différents âges en utilisant le réseau de neurones convolutionnel pré-entraı̂né VGG16[25],
le réseau de neurones artificiel (ANN) [24] et autres méthodes[11]. Le meilleur résultat
de cette étude est obtenu avec le CNN (96%). Les auteurs montrent l’efficacité du CNN
(utilisant l’architecture VGG16) à détecter les palmiers de tout âge. Ainsi l’inconvénient
de cette approche dans le cadre de notre étude est qu’elle a été appliquée dans une zone
de plantation et non dans un milieu naturel où les couronnes sont imbriquées les unes des
autres. Giorgio Morales et al.[20] en 2018 ont mené des travaux sur la forêt amazonienne
notamment sur le palmier Mauritia flexuosa. Les auteurs ont utilisé un modèle basé sur
l’architecture Deeplab v3+[1]. Le modèle a été formé pour détecter et segmenter les palmiers flexuosa de l’ı̂le Maurice à différents stades de croissance et à différentes échelles.
Cependant, il faut mentionner que les méthodes utilisées par les auteurs sont formées
pour classer les couronnes d’arbres visibles dans les images ; par conséquent, si la majeure
partie d’une couronne est couverte par des arbres plus grands, le modèle ne parvient pas à
la détecter. Bien que cette étude soit sur le palmier en milieu naturel avec une précision de
98%, elle n’intervient pas dans le cadre de notre étude où les couronnes sont imbriquées les
unes des autres, car la méthode permet de détecter les palmiers jeunes et adultes qui sont
isolés. Dans l’article [31] écrit par G.Viennois et al., les travaux sont expérimentés sur le
palmier Rafia. Leur travail a constitué à utiliser le réseau de neurones convolutionnel pour
la détection du palmier Rafia en milieu naturel sur des images drone (5 ortho-mosaı̈ques).
Le réseau utilisé est le Faster R-CNN sous l’environnement Caffe avec une architecture
VGG-16[29] pré-entraı̂né sur la base de données annotées PASCAL VOC 2007 [6]. L’évaluation de leur modèle donne un taux de 63% et montre la difficulté à dénombrer ces
plantes en milieu naturel étant donné que les annotations expertes des Rafias est très
9
- Xem thêm -