Résumé de la thèse
Ces dernières années, nous assistons à une émergence des méthodes d’apprentissage profond appelées Deep Learning en anglais (DL), qui ont favorisé d’énormes progrès dans divers domaines. Le succès de ces méthodes résulte de la disponibilité sans cesse croissante de grandes quantités d’informations ainsi que des puissances de calcul des ordinateurs. Dans le domaine de la télédétection, on dispose aujourd’hui de volumes considérables d’images satellites grâce au nombre élevé de satellites d’observation de la Terre qui gravitent autour de la planète. Cette disponibilité en images permet de constituer des séries chronologiques de données appelées séries temporelles d’images satellite (STIS). Les STIS peuvent être utilisées pour de multiples applications du monde réel comme la prédiction des changements des classes d’occupation des sols, notamment la déforestation. Dans le cadre de cette thèse, il est question d’exploiter les potentialités des algorithmes d’apprentissage profond et la disponibilité des STIS pour créer des modèles basés sur l’apprentissage profond, capables d’analyser les données historiques d’une zone donnée et de prédire la déforestation dans cette zone. Quatre contributions sont apportées pour ces travaux de thèse. Premièrement, nous définissons un workflow de collecte et de prétraitement par lot des images satellite Sentinel-1 qui nous a permis de mettre à la disposition de la communauté scientifique trois jeux de données d’apprentissage. Deuxièmement, pour déterminer quelle architecture DL est la plus adaptée pour la prédiction des STIS, nous évaluons trois variantes d’architectures LSTM (ConvLSTM, CNN-LSTM, Stack-LSTM) pour la prédiction de la prochaine occurrence dans une séquence d’images. Ensuite, nous montrons par une étude comparative, que les méthodes DL permettent d’obtenir de meilleurs résultats que la méthode classique CA-Markov pour la prédiction des changements des classes d’occupation des sols. Pour finir, nous proposons un modèle basé sur l’architecture hybride CNN-LSTM pour prédire la déforestation autour de la réserve de Biosphère du Dja (Cameroun) en 2025 comme cas d’utilisation. Le modèle entraîné sur des images Sentinel-1A a permis d’estimer une hausse approximative de 6% de déforestation dans cette zone. Pour cette contribution, nous définissons également une stratégie d’augmentation des données permettant d’améliorer les performances du modèle.
Mots clés : Deep learning, Apprentissage Profond, Réseaux de Neurones Artificiels, Analyse prédictive, ConvLSTM, CNN-LSTM, STIS, Déforestation.
Contributions scientifiques :
- Proposition d’un outil pour la collecte et le prétraitement automatisé des images satellites Sentinel-1. L’ensemble des scripts utilisés et les données constituées ont été mis à la disposition de la communauté scientifique à l’adresse http://w-abdou.fr/sitis/. Cette contribution a donné lieu à la publication d’un article dans une revue internationale [1]. L’article propose un flux de travail pour la collecte, le prétraitement et la préparation des images Sentinel-1 en vue de leur utilisation avec les algorithmes Deep Learning. Le processus consiste principalement à utiliser des scripts pour les opérations de collecte et de prétraitement. L’objectif de ce travail était non seulement de fournir à la communauté scientifique des programmes facilement modifiables pour la collecte d’images Sentinel-1 et le prétraitement par lots, mais aussi de publier une base de données avec les images prétraitées. Les résultats expérimentaux ont permis de construire trois séries temporelles d’images Sentinel-1 correspondant à trois zones d’étude, à savoir le parc national de Bouba-Ndjida (Cameroun), la réserve de biosphère du Dja (Cameroun) et la réserve de faune de Togodo (Togo). Au total, 628 images ont été traitées à l’aide de scripts basés sur l’outil de traitement des graphes SNAP (GPT). Afin de tester l’efficacité de la méthodologie proposée, trois modèles DL ont été entraînés avec les images de Bouba-Ndjida et de Togodo pour la prédiction de l’occurrence suivante dans une séquence.
- Publication d’un état de l’art sur les travaux utilisant les méthodes Deep Learning (DL) pour la prédiction des séries temporelles d’images satellites [2]. Cet article donne un aperçu des principaux éléments utilisés pour concevoir et évaluer les modèles prédictifs, à savoir les architectures, les données, les fonctions d’optimisation et les mesures d’évaluation. Les modèles DL étudiés sont divisés en trois catégories, à savoir les modèles basés sur les réseaux neuronaux récurrents, les modèles hybrides et les modèles feed-forward (réseaux de neurones à convolution et perceptrons multicouches). Les principales caractéristiques des images satellites et les principales applications existantes dans le domaine de la prédiction des séries d’images satellites sont également présentées dans cet article. Ces applications comprennent la prévision météorologique, la prévision immédiate des précipitations, l’analyse spatio-temporelle et la reconstruction des données manquantes. Enfin, les limites actuelles et les solutions proposées en ce qui concerne l’utilisation du DL pour la prédiction des séries temporelles d’images satellitaires sont également soulignées.
- Comparaison des méthodes CA-Markov et des algorithmes d’apprentissage profond pour la prédiction des changements des classes d’occupation de sol. Cette contribution a été valorisée par un article présenté à la conférence SITIS 2022 [3]. Cet article présente la comparaison de ces deux méthodes de prédiction des changements. Des modèles basés sur les méthodes CA-Markov, ConvLSTM et CNN-LSTM ont été appliqués tour à tour sur des images Sentinel-1A du Parc National de Bouba-Ndjida (Cameroun), afin de prédire l’image suivante d’une séquence d’images donnée en entrée. Plusieurs métriques ont été utilisées pour évaluer les modèles. Les résultats expérimentaux ont indiqué que les modèles basés sur les algorithmes DL, et en particulier sur les réseaux ConvLSTM, sont mieux adaptés à la prédiction des changements des classes d’occupation de sol.
- Evaluation des algorithmes Deep learning pour la prédiction de la prochaine occurrence dans une séquence d’images satellites sentinel-1. Pour cette contribution, les résultats expérimentaux ont été présentés à la conférence internationale CARI (Colloque Africain sur la Recherche en Informatique et en Mathématiques) [4]. Les modèles Stack-LSTM, CNN-LSTM et ConvLSTM ont été appliqués à une série temporelle d’images radar Sentinel-1, le but étant de prédire la prochaine occurrence dans une séquence. Les résultats expérimentaux évalués à l’aide des indicateurs de performance tels que le RMSE et le MAE, le temps de traitement et l’indice de similarité SSIM, ont montré que chacune des trois architectures pouvait produire de bons résultats en fonction des paramètres utilisés.
- Proposition d’un modèle hybride CNN-LSTM pour la prédiction de la déforestation dans une zone forestière en Afrique Centrale (Réserve de biosphère du Dja au Cameroun). Cette contribution n’a pas encore donné lieu à une publication. L’article relatif à cette partie est en effet en cours de rédaction et sera soumis à une revue internationale [5]. Les résultats des expérimentations ont permis de simuler une hausse de la déforestation d’environ 6% dans la zone d’étude choisie en 2025.
Perspectives :
Comme perspective immédiate à mes travaux de recherche, j’envisage premièrement appliquer les techniques telles que le few-shot learning (FSL), le meta-learning ou le transfer-learning pour la prédiction des STIS afin d’améliorer les capacités de généralisation des modèles et pour permettre d’exploiter les avantages qu’offrent les architectures ConvLSTM. En effet, le FSL est une technique en apprentissage automatique permettant d’obtenir des résultats satisfaisants à partir d’un ensemble de données limité. Le FSL est surtout utilisé pour des problèmes de vision par ordinateur et peut être considéré comme un problème de meta-learning où le modèle apprend comment apprendre à résoudre un problème donné. En ce qui concerne le transfer-learning, il s’agit d’un ensemble de techniques permettant de transférer les connaissances acquises par un modèle pour traiter un autre problème similaire. Cette méthode de transfert d’apprentissage permettra de réutiliser le modèle de prédiction de déforestation sur d’autres zones, sans avoir à ré-entraîner totalement le modèle.
Par la suite, je prévois intégrer d’autres architectures DL qui ne s’appuient pas sur LSTM pour réaliser la prédiction. J’envisage donc introduire de nouvelles méthodes basées sur la combinaison de plusieurs approches, permettant d’atteindre de meilleures précisions. En effet, des architectures d’apprentissage non supervisé telles que les réseaux antagonistes génératifs qui permettent de générer des images, ou les réseaux auto-encodeur qui réduisent la taille des données, combinés aux réseaux LSTM ou réseaux Gated Recurent Unit (GRU) pourraient être une bonne solution pour la prédiction des STIS.
Pour finir, je compte explorer les méthodes de fusion les images radar et optiques pour une meilleure discrimination des surfaces végétales. En effet, les images radar sont bien adaptées pour le suivi des surfaces forestières. Cependant, une confusion entre les classes d’occupation des sols « forêt » et « non-forêt » est souvent possible et altère la qualité des classifications. Une fusion des images optiques et radar permettra de mieux différencier les zones de forêts des autres types de sols et d’améliorer la robustesse du modèle de prédiction.
A moyen terme, j’envisage également explorer d’autres applications que la déforestation notamment la prédiction des inondations, de la dégradation des sols, de la couverture neigeuse, etc.