Automatisation partielle de la statistique de la superficie du sol à l'aide des informations des voisins spatio-temporels

L'une des missions de l'Office fédérale de la statistique (OFS) porte sur la production de la Statistique de la superficie, un instrument qui permet de mesurer la conformité de la couverture et de l’utilisation du sol avec les objectifs du développement territorial, à une certaine époque ansi que dans le temps. Nous renvoyons le lecteur à cette page pour de plus amples informations. En ce qui concerne ce document, il convient de citer cet extrait : “L'interprétation de l'utilisation et de la couverture du sol est effectuée pour des points d'échantillonnage fixes, superposés aux photographies aériennes sur une grille de 100 m sur 100 m“. Il convient également de préciser que l'interpretation de chacun de ces points comporte l'attribution d'une classe (sur 27) relative à l'occupation et une classe (sur 46) relative à la couverture.

 

 

Depuis 2022, l'Office fédérale de la statistique utilise une solution informatique innovante, propulsée par l'intelligence artificielle (IA), qui permet d'automatiser partiellement le processus de classification des points d'échantillonage fixes et, par conséquent, raccourcir les cycles de mise à jour. Plusieurs indicateurs sont utilisés comme entrée par l'IA. L'OFS a chargé le STDL d'étudier l'opportunité d'utiliser, pour chaque point d'échantillonage, un enième indicateur, construit sur la base des classifications précedentes (“voisins temporels“) de ce même point ainsi que de ses proches voisins (“voisins spatiaux“). Ce projet permettra de déterminer si les “voisins spatio-temporels“ contiennent de l'information utile à la classification et/ou à la prédiction d'un probable changement par rapport à la classification précedente.

 

 

Le projet a exploré le mécanisme de transformation interne des statistiques du sol suisse du point de vue de l'analyse des données et a construit un prototype qui effectue la détection des changements pour une tuile dans la classification suivante. Nous avons mis en œuvre plusieurs nouvelles techniques d'apprentissage automatique pour accélérer le travail d'interprétation, en particulier avec des algorithmes d'apprentissage profond tels que le "Fully Connected Network" et le "Convolutional Recurrent Neural Network". En utilisant les données temporelles et spatiales du voisinage, notre prototype améliore les performances d'environ 15,8 % par rapport à la baseline (6 % en métrique). Grâce au flux de travail conçu, le projet permettra d'économiser 30 à 40 % de la charge de travail d'interprétation estimée selon les résultats de la recherche.

 

Le documentation technique est accessible sur notre site technique.

Le code source est disponible ici.

 

« retour