Amélioration de la chaîne de géoréférencement de planches scannées du cadastre ancien : de la vectorisation au mosaïquage

Problèmatique

Les plans cadastraux anciens représentent une information précieuse sur un territoire, par exemple pour l’analyse de l’évolution du parcellaire au cours du temps en lien avec les politiques d’aménagement. Ces plans se présentent sous forme de feuilles au format papier. Selon leur année de création et les conditions de leur conservation, les plans sont de qualité très inégale. Dans un certain nombre de collectivités, ces plans ont été scannés. C’est le cas pour la Sarthe avec les cadastres de 1813, 1850 et 1972-74.
Trois étapes sont requises avant de pouvoir exploiter ces données scannées dans un SIG : la vectorisation, le géoréférencement et le mosaïquage. Le laboratoire GeF met en place depuis 2014 une chaîne de traitement semi-automatique en se basant sur des outils libres (PPP 2014, TFE M. Fahrasmane 2016, TFE Odie 2017, TFE Beveraggi 2018).
L’objectif de ce TFE est de compléter le travail déjà réalisé pour rendre la chaîne plus performante, plus simple dans son utilisation et plus automatique. Par ailleurs, l’analyse de cette chaîne devra être réalisée sur plus de données test.

Contexte de l'étude

A chaque étape de la chaîne, des améliorations pourront être introduites.

Lors de la première étape, la vectorisation des limites cadastrales, étudiée lors du TFE de 2017, est réalisée soit par une transformée de Hough probabiliste, soit par une méthode de suivi de chemin. Ces deux méthodes présentent des avantages et des inconvénients, et le TFE consistera à mettre en place et tester la transformée de Hough localisée et éventuellement la méthode LSD. L’extraction des numérotations des parcelles sera aussi un plus dans le résultat.

De plus, on peut s’attendre à des défauts résiduels en fin de traitement de vectorisation tels que des limites de parcelles non fermées et des confusions liées à la présence de rivière ou de routes. L’approche par graphe débutée avec le TFE en 2018 sera poursuivie pour élaborer et guider un processus automatique de corrections.

Le calcul du géoréférencement est performant et écrit en langage Python depuis le TFE de 2016. Cette étape ne nécessitera pas de nouveaux développements.

Enfin, la méthodologie pour le mosaïquage a été mise en place lors du TFE de 2018. Le principal défaut de ce processus est qu’il nécessite l’utilisation de plusieurs logiciels (Python, QGIS). Le TFE devra s’appuyer davantage sur le langage Python (en utilisant des bibliothèques comme GeoPandas) pour rendre cette étape plus simple d’utilisation et plus automatique. Des améliorations avec l’exploitation des graphes seront aussi étudiées.

Objectifs visés

  • Mise en place d’une ou plusieurs autres méthodes de vectorisation des limites parcellaires
  • Compléments éventuels pour la vectorisation des numéros de parcelles
  • Mise en place d’un processus de corrections de la vectorisation grâce à une approche par graphe
  • Mise en place du processus de mosaïquage en langage Python
  • Analyse rigoureuse des résultats sur plusieurs dates, plusieurs communes et éventuellement plusieurs types de plan à chaque étape de la chaîne de traitement.

Moyens mis à disposition

  • Poste informatique avec les logiciels nécessaires (QGIS/GRASS, Python, ….)
  • Données du projet

Gratification / prise en charge financière

Indemnité légale (1/3 du SMIC)

Mots clefs

Cadastre ancien, SIG, traitement d’image, programmation Python, théorie des graphes