Géocodage, le préalable à toutes vos applications d’analyse, de visualisation et d’optimisation spatiale
Que vous ayez pour objectif d’optimiser des tournées de livraisons, d’analyser des zones de chalandise, d’exploiter des techniques de géomarketing ou de définir la sectorisation optimale pour votre force de vente, le géocodage est le point de départ incontournable.
C’est lui qui va vous permettre d’appréhender la dimension géographique de votre activité et d’en tirer pleinement partie dans vos applications et processus métiers.
Pour partir sur de bonnes bases, commençons par une définition en bonne et due forme :
Le géocodage est l’opération qui consiste à affecter des coordonnées géographiques (X, Y / latitude, longitude) à une adresse postale de manière à la localiser avec exactitude.
Tout objet possédant ou pouvant être rattaché à une adresse postale peut être géocodé.
En géocodant vos fichiers clients, la liste de vos établissements, de vos entrepôts, de vos concurrents ou tout autre fichier contenant des adresses, vous les rendez exploitables par une large gamme d’applications de visualisation, d’analyse et d’optimisation. Ces applications ont en effet impérativement besoin des coordonnées géographiques de chaque enregistrement pour les localiser, effectuer des regroupements, calculer des itinéraires ou des tournées, définir des secteurs commerciaux ou des aires d’influence… Les coordonnées géographiques sont un véritable sésame : sans elles, aucun de ces traitements n’est possible.
Comprendre le mécanisme du géocodage
Pris isolément, le géocodage est une opération d’enrichissement de données qui met en jeu trois composantes :
- Des données d’entrée, c’est-à-dire un fichier d’adresses postales au format texte. Ce peut être un fichier plat, un fichier Excel, une liste extraite d’une base de données clients, d’un CRM, d’un ERP ou autre système externe.
- Un référentiel, c’est-à dire une base de données répertoriant, sous une forme normalisée, toutes les adresses qui existent sur un territoire ainsi que les coordonnées géographiques de chaque adresse.
- Un moteur de géocodage. Il s’agit d’un algorithme qui va interpréter les données d’entrée et rechercher dans le référentiel la meilleure correspondance possible pour chaque adresse afin de lui attribuer les coordonnées X,Y appropriées.
C’est une description très simplifiée, mais elle a le mérite d’éclairer les trois points (développés ci-après) qu’il faut absolument avoir à l’esprit avant de se lancer dans l’acquisition et l’utilisation d’une solution de géocodage.
1 – La qualité des données d’entrée est cruciale
Vous pouvez avoir le moteur de géocodage le plus puissant du marché et utiliser le référentiel le plus exhaustif qui soit, si vos données sont de mauvaise qualité, l’algorithme sera dans l’incapacité de faire des rapprochements pertinents et justes entre les adresses que vous lui soumettez et celles qui se trouvent dans le référentiel. Confronté à des adresses imprécises, incomplètes, mal structurées, le moteur de géocodage peut avoir deux comportements :
- Générer des « faux positifs », c’est-à-dire interpréter vos adresses de manière erronée et leur attribuer des coordonnées géographiques qui ne leur correspondent pas. Si votre géocodage a pour objectif d’alimenter un logiciel de planification de livraisons, vous pouvez aisément imaginer les conséquences opérationnelles de ces erreurs…
- Rejeter purement et simplement un grand nombre d’adresses faute d’avoir trouvé une correspondance. Vous devrez alors traiter ces rejets à la main, en examinant et en rectifiant les adresses une par une…
Chez Nomadia, nous savons d’expérience que les entreprises ont tendance à surestimer la qualité de leurs fichiers d’adresses. C’est pourquoi nous recommandons un audit préalable des bases de données à géocoder, suivi d’un nettoyage et d’une mise aux normes des différents champs que comporte une adresse postale exacte : n° de voie, nom de voie, code postal, nom de commune, pays.
Mais si vous voulez réduire durablement les taux d’erreur et de rejet du moteur de géocodage, la meilleure solution est d’agir en amont, au niveau de la collecte initiale, en mettant en place des contraintes de saisie et des aides à la normalisation d’adresses dans vos applications et formulaires de recueil d’adresses. Vous évitez ainsi les noms de commune ou de voie fantaisistes, les abréviations incompréhensibles, les codes postaux qui n’existent pas ou saisis dans le mauvais champ, et surtout l’enregistrement d’adresses incomplètes (impossibilité d’enregistrer une adresse si tous les champs requis ne sont pas renseignés).
2 – La fiabilité du référentiel fait la différence
Le choix du référentiel a lui aussi une grande importance. La plupart des éditeurs de solutions de géocodage travaillent avec plusieurs fournisseurs et vous permettent de choisir le référentiel le plus adapté à vos besoins en termes de précision, de couverture géographique (France, Europe, Monde) et de fréquence des mises à jour. Pour un géocodage de haute précision – « à l’adresse exacte » – mieux vaut se tourner vers des référentiels établis par des acteurs dont la réputation n’est plus à faire, tels que l’IGN et HERE, tous deux partenaires de Nomadia, ainsi que TELE ATLAS et TOMTOM.
Il est également possible de se tourner vers des référentiels dits « libres », issus de la collecte communautaire, dont l’utilisation est gratuite. Du fait de son antériorité et de sa couverture mondiale, OpenStreetMap est sans doute l’offre de ce type la plus complète dans cette catégorie. Elle est d’autant plus fiable pour la France que, depuis 2016, l’IGN a mis sa couverture aérienne à disposition de la communauté OpenStreetMap sur l’ensemble du territoire français.
Impossible enfin de ne pas mentionner le référentiel Google Maps. S’il est de bonne qualité et mis à jour en continu, il se révèle rapidement onéreux pour les entreprises qui l’utilisent intensivement à des fins de géocodage. Autre réserve importante : si vous optez pour ce référentiel, vous ne pourrez pas conserver les coordonnées géographiques obtenues via Google Maps, ni les exploiter partout où vous pourriez en avoir besoin. Ces données restent la propriété de Google.
D’où notre conseil : en choisissant votre référentiel, vérifiez non seulement qu’il contient toutes les données dont vous avez besoin sur le périmètre qui vous intéresse, mais aussi les conditions d’utilisation de ces données, le statut des résultats de vos géocodages et le coût des mises à jour.
3 – Le moteur de géocodage ne doit pas être une « boîte noire »
Il existe deux grands types de solutions de géocodage :
- Les moteurs de géocodage autonomes, qui peuvent être déployés de manière isolée, ou bien faire l’objet d’une intégration sur mesure avec des applications tierces pour alimenter des chaînes de traitements ou des processus métiers spécifiques.
- Les modules de géocodage qui, de plus en plus fréquemment, sont intégrés en standard dans les solutions packagées d’optimisation de tournées, de géomarketing ou de sectorisation territoriale.
Dans un cas comme dans l’autre, vous devez avoir la possibilité de faire du géocodage ponctuel et à la volée (à chaque fois qu’une adresse est saisie dans une application source, elle est automatiquement géocodée) ; du géocodage par lot (mode batch), indispensable pour les grosses volumétries ; et du géocodage incrémental, permettant de raccourcir les temps de traitement en ne géocodant que les adresses nouvellement entrées dans la base de données source. Ces processus doivent pouvoir être entièrement automatisés et réalisés en back-office ou être déclenchés par l’utilisateur.
Quelle que soit la manière dont vous l’implémentez et l’utilisez, un moteur de géocodage doit offrir des options de paramétrage et une interface de gestion des erreurs et des enregistrements rejetés. Sans ces outils d’interaction et de contrôle, votre moteur de géocodage ressemble à une boîte noire dont vous ne maîtrisez pas les stratégies de reconnaissance, de rapprochement et d’apprentissage. Pour éviter cet « effet boîte noire », les critères de tolérance du moteur de géocodage peuvent être modifiés et ses stratégies de choix orientées. Il comprend également un assistant de géocodage qui affiche un score de reconnaissance, propose des suggestions de correction pour les enregistrements rejetés et permet de mémoriser les corrections effectuées. Vous avez ainsi la possibilité de capitaliser les acquis, tout en restant maître du niveau de rigueur appliqué aux données par l’algorithme.
Maintenant que vous savez ce à quoi vous devez être attentif en choisissant une solution de géocodage, passez à l’étape suivante : parlons de votre projet !