Détection d’anomalies avec apprentissage profond pour délimiter les feux de forêt sur les images SPOT-6/7
le 23 octobre 2023
Les feux de forêt sont de plus en plus fréquents et causent d’importants dégâts socio-économiques et environnementaux. Par conséquent, la détection et la délimitation des incendies est devenu un enjeu majeur, en particulier dans ce contexte de changement climatique. Cela a progressivement conduit au développement de nouvelles méthodologies, dont le potentiel intéresse notamment les acteurs de la gestion des catastrophes naturelles. Reflétant cette tendance, Oscar Narvaez, stagiaire au sein d’ICube-SERTIT en 2023, a travaillé sur un projet exploratoire visant à évaluer le potentiel et l’applicabilité des méthodes d’apprentissage profond non supervisé, pour la délimitation des feux de forêt avec des images à très hautes résolution spatiale SPOT.
Données et méthodes
Les méthodes non supervisées sont couramment utilisées dans la littérature pour détecter les anomalies. En partenariat avec l’équipe IRISA/OBELIX et en s’inspirant des travaux de recherche de Gangloff et al. (2022) sur la détection d’anomalies, nous avons utilisé des Vector-Quantized Variational Autoencoders (VQ-VAE) pour cartographier les incendies. Bien que les VQ-VAE soient généralement destinés à la reconstruction d’images, ils présentent également un potentiel pour la détection d’anomalies. Plus précisément, lorsque le modèle est entraîné sur des images pré-évènement dépourvues de tout feu de forêt visible, la reconstruction d’images post-évènement présentant des zones brûlées évidentes sera de mauvaise qualité. Cela s’explique par le fait que ces images post-évènement ne correspondent pas à la distribution apprise par le modèle. Par conséquent, les pixels décrivant les zones brûlées ressortent comme des valeurs aberrantes, ce qui facilite leur détection.
Le jeu de données a été fourni par le SERTIT. Il s’articule notamment autour d’images SPOT-6/7, collectées dans le cadre des activations du Copernicus Emergency Mapping Service (CEMS), suite à des feux de forêt. Les activations en question correspondent à EMSR375 en Espagne (Ségovie), et à EMSR224 en Grèce (Kalamos). Pour l’entraînement du modèle, une pile de 3 bandes (proche infrarouge, rouge et vert) a été générée à partir de l’image SPOT pré-évènement d’EMSR375 seulement, celle d’EMSR224 n’étant malheureusement pas disponible. Le modèle en question a ensuite été testé sur les images post-évènement des deux activations EMSR224 et EMSR375. La validation des résultats a été réalisée en utilisant les données de délimitation des incendies, disponibles sur le site internet de CEMS.
Figure 1. Comparaison des images avant et après l’événement des feux de forêt EMSR375 et EMSR224
Pour générer les cartes d’anomalies, nous avons combiné les sorties générées par l’encodeur dans l’espace latent (Alignment map “AM”) avec les sorties du décodeur (Reconstruction-based map “SM”). Cela a permis de produire une carte d’anomalies complète. Enfin, les valeurs d’anomalie ont été seuillées à l’aide d’une courbe ROC et des données de référence disponibles, afin de délimiter les zones jugées par le modèle comme étant anormales.
Figure 2. Déroulement du processus d’inférence et de validation des résultats de la VQ-VAE.
Résultats et conclusions
Les résultats de cette étude ont révélé que le modèle en lui-même n’était pas en mesure de délimiter exclusivement les zones brûlées. En effet, il incluait de nombreux éléments de l’image post-évènement, tels que des formes urbaines complexes et des roches nues. Pour affiner les résultats, une approche de post-traitement a été proposée afin de filtrer ces faux positifs, tout en conservant les zones brûlées. Ce post-traitement comprend trois masques, à savoir l’indice de végétation par différence normalisée (Normalized Difference Vegetation Index, NDVI), l’indice d’eau par différence normalisée (Normalized Difference Water Index, NDWI) et l’indice de luminosité basé sur Landsat (Landsat-based Brightness Index, BITM). Ensuite, un tamisage (sieving) a été utilisé pour ne retenir que les groupes de pixels les plus grands, généralement associés aux zones brûlées.
Figure 3. Délimitation fournie par le CEMS et utilisée comme vérité terrain, comparée à la prédiction du modèle sans post-traitement.
Après avoir effectué le post-traitement, la délimitation de la région brûlée s’est améliorée de manière significative, s’alignant plus étroitement avec la vérité terrain. Cette étape supplémentaire a permis une cartographie plus précise de la zone brûlée lors du feu de forêt. Cependant, la polyvalence de la méthode reste un défi, en particulier son applicabilité à différentes régions et différents capteurs. Lorsque le même modèle a été testé sur d’autres activations utilisant à la fois des images SPOT-6/7 et Pléiades, il a fait preuve d’incohérence dans la délimitation des zones brûlées. Des ajustements supplémentaires sont donc nécessaires, notamment en ce qui concerne les seuils utilisés pour générer les masques dérivés des indices spectraux, en effet, ils sont d’une importance primordiale pour éliminer les anomalies susceptibles de produire des faux positifs. Néanmoins, ces résultats étaient attendus, car ils font partie des verrous inhérents aux méthodes de détection des anomalies, en raison de la complexité des images satellitaires et du vaste éventail de cas de figure à considérer.
Figure 4. Comparaison du vrai label avec la prédiction du modèle après l’étape de post-traitement.
Pour plus d’informations sur la méthode, les résultats et les scores de validation, veuillez-vous référer à la version pré-imprimée de l’article présenté à l’atelier MACLEAN pendant l’ECML PKDD 2023 à Turin en Italie. Lien ci-dessous :
https://arxiv.org/abs/2308.13367
Note complémentaire
Les lecteurs peuvent noter des différences entre le diagramme du processus d’inférence (Figure 2) dans ce billet, et l’article en lien plus haut. L’article en question présente les résultats du projet en date du mois de juin 2023. Depuis, des améliorations ont été apportées en entraînant le modèle sur 4 bandes (rouge, vert, bleu, proche infrarouge), en utilisant la carte basée sur la reconstruction (SM) et en introduisant le tamisage comme étape supplémentaire de post-traitement. Ces améliorations ont permis d’obtenir une délimitation plus précise, comme le montre la figure 4 de ce billet.
Dans la suite de ce travail, nous souhaitons utiliser un jeu de données plus riche lors de l’entraînement, afin d’améliorer les performances du modèle. Cela devrait lui permettre de tenir compte d’une plus grande diversité de types d’occupation du sol et de dynamiques saisonnières. Avec ces modifications et une optimisation des hyper-paramètres du modèle, une meilleure généralisation aux différents cas observés en activation CEMS est attendue.
Références
Gangloff, H., Pham, M.T., Coutrai, L., Lefèvre, S. (2022). Leveraging vector-quantized variational autoencoder inner metrics for anomaly detection. In: 2022 26th Inter- national Conference on Pattern Recognition (ICPR), pp. 435–441.
Luces, O. D. R., Pham, M.T., Poterek, Q., Braun, R. (2023) Burnt area extraction from high-resolution satellite images based on anomaly detection. arXiv preprint arXiv:2308.13367.