[Inside Nomadia] - Le Pôle Data de Nomadia : les experts de la donnée qui rendent vos applications possibles
Vous utilisez les solutions Nomadia au quotidien, mais que savez-vous des données qui servent à géocoder vos adresses, calculer vos itinéraires et optimiser vos tournées ? A la tête du Pôle Data de Nomadia, Xavier Roumanie nous explique d’où viennent ces données, comment elles sont intégrées, actualisées et mises à disposition dans vos outils pour répondre à vos besoins opérationnels – sans que vous ayez à vous en occuper.
Quel est le rôle du Pôle Data de Nomadia ?
C’est un rôle totalement transversal puisque tous les produits Nomadia s’appuient sur des ensembles de données sans lesquels nos logiciels seraient comparables à des moteurs sans carburant. Quand vous utilisez une solution Nomadia, vous utilisez en réalité deux choses : un moteur logiciel qui fournit un certain nombre de services et de fonctionnalités, et des données de référence, c’est-à-dire indépendantes de l’utilisateur, qui alimentent ce moteur.
L’équipe que je dirige est composée d’ingénieurs cartographes et de développeurs qui produisent ce ‘carburant’ à partir de données brutes provenant de différents fournisseurs. L’essentiel de notre travail consiste à transformer ces données et à les intégrer pour qu’elles soient directement exploitables par les fonctionnalités de nos logiciels, que ce soit pour afficher des cartes, localiser des adresses, calculer des itinéraires et tracer des isochrones ou ordonnancer des tournées.
De quels types de données s’agit-il ?
On peut les classer en 3 catégories. Il y a tout d’abord les données ayant une dimension géographique/cartographique. Elles constituent le socle des applications en permettant de localiser et caractériser les routes, les bâtiments et tous les éléments qui ont une position dans l’espace. Pour cette catégorie de données, nous travaillons principalement avec deux fournisseurs : HERE, qui est un des leaders mondiaux du marché de la data de localisation et dont nous achetons les données brutes ; et, sur le périmètre national, l’IGN dont les données sont désormais en libre accès. On peut y ajouter les données de la base collaborative OpenStreetMap. Outre une couverture mondiale et des centaines de catégories de points d’intérêt, HERE présente l’avantage d’offrir énormément d’attributs caractérisant très finement le réseau routier, ce qui renforce la précision et la fiabilité des calculs d’itinéraires et de tournées réalisés en aval.
Nous intégrons également ce que nous appelons des données ‘attributaires’, en particulier celles de l’Insee, telles que les données du recensement à la maille IRIS, avec plus de 1200 variables, et le fichier SIRENE qui fournit des informations sur 11 millions d’établissements classées par codes d’activité (code NAF). Ce sont ces données qui permettent aux utilisateurs de nos solutions de réaliser des études de zone de chalandise ou des analyses de bassin de vie basées sur les caractéristiques socio-démographiques des ménages.
Enfin, nous intégrons les points adresse de la Base d’Adresse Nationale (BAN) qui est la seule base de données d’adresses officiellement reconnue par l’administration avec aujourd’hui plus de 25 millions d’adresses localisées avec la plus grande précision.
Comment ces données brutes deviennent-elles exploitables par les solutions Nomadia ?
Pour les données HERE et IGN, nous avons développé une chaîne de traitement automatisée qui prend en entrée les données brutes de nos fournisseurs et les met au format propre à Nomadia. En sortie, le Pôle Data livre 3 types de produits :
- des fichiers ‘display’ qui servent à afficher les cartes ;
- des fichiers ‘routing’, c’est-à-dire les graphes qui contiennent toutes les données nécessaires au calcul d’itinéraires, d’isochrones, de distanciers, etc.
- des fichiers de géoréférencement ou ‘géocoding’ qui, à partir d’une adresse, permettent d’obtenir ses coordonnées géographiques (X,Y) et de positionner ce point sur la carte.
Comme l’IGN et HERE publient des mises à jour de leur données tous les trimestres, de nouvelles versions de ces 3 produits – display, routing et geocoding – sont réalisées chaque trimestre afin de fournir à nos clients finaux les données les plus récentes. Avant d’être distribuées, ces nouvelles versions sont testées sur l’ensemble de nos logiciels de façon à s’assurer de leur qualité et à éviter tout risque de régression.
Sous quelle forme les clients ont-ils accès à ces données ?
Aujourd’hui, la majorité de nos clients utilisent les versions SaaS des solutions Nomadia. Ils bénéficient automatiquement de mises à jour trimestrielles, sans rien avoir à télécharger ni installer. L’accès aux données et leur exploitation se font via ce que nous appelons des ‘GeoAPI’. Ce sont des services Web qui couvrent les 3 fonctions de base présentes dans toutes nos solutions : l’affichage de cartes, le calcul d’itinéraires et le géocodage.
Comment sont élaborés les graphes Nomadia et qu’ont-ils de spécifique ?
Le graphe est l’élément indispensable pour le calcul d’itinéraires et de tournées. La qualité des données du graphe détermine en particulier les vitesses moyennes sur chaque tronçon de route, en fonction du type de voie et du type de véhicule. C’est ce qui permet à nos logiciels de calculer des temps de trajet réalistes. Pour un maximum de précision, nous utilisons de nombreux attributs de la base de données routières HERE pour déterminer des « speed patterns » correspondant aux spécificités de chaque tronçon de voie. En croisant des attributs tels que la vitesse maximale autorisée, le nombre de voies de circulation, la présence ou non de séparateur de voies, les sens de circulation, l’environnement urbain/non urbain, nous avons établi une typologie d’environ 350 familles de route.
À chacune de ces catégories de route, on associe des catégories de véhicules, sachant que la vitesse moyenne d’une voiture sera supérieure à celle d’un utilitaire léger, elle-même supérieure à celle d’un poids lourd. En plus de ces profils de véhicules, nous appliquons des conditions de trafic selon les jours et les heures. Nous avons établi 5 niveaux qui vont de la circulation la plus fluide à l’embouteillage. Le fait de croiser tous ces paramètres et d’intégrer dans nos graphes toutes les restrictions/contraintes de circulation (hauteur et largeur limitées, sens uniques, pistes cyclables, zones piétonnières, etc.) se traduit par des temps de trajet bien plus proches de la réalité que si nous prenions en compte seulement la vitesse autorisée, comme c’est le cas de certaines applications. C’est fondamentalement ce qui permet à nos clients d’établir des tournées fiables, qu’il s’agisse de livraisons ou d’interventions sur le terrain.
Quelles ont été les grandes évolutions de ces dernières années dans le domaine des données géographiques et routières ?
Le phénomène le plus marquant est le développement de l’open data. De plus en plus de données sont ouvertes et en libre accès. En témoigne l’ouverture des données de l’IGN et de l’Insee. La BAN en est un autre exemple. Cette base d’adresses était auparavant gérée par l’IGN. Elle est aujourd’hui pilotée par la Direction Interministérielle du Numérique (DINUM) et alimentée directement par les communes qui peuvent à tout moment intégrer de nouvelles voies, de nouveaux numéros, de nouvelles adresses de bâtiments ou des modifications de nom de rue. Enrichie quotidiennement, la BAN offre un niveau de précision inégalé pour toutes les applications de géocodage.
La donnée collaborative a gagné et continue de gagner du terrain. Open Street Map en est l’archétype, mais HERE n’est pas en reste. Son outil Map Creator permet à une large communauté de créer et de modifier des données de vitesse, de revêtement de sol, de numérotation, etc. pour accroître la richesse et la précision de ses bases de données.
L’acquisition de données par le biais des véhicules est aussi une évolution notable. C’est notamment le cas chez HERE qui appartient depuis 2015 au consortium de constructeurs allemands BMW, Mercedes-Benz et Audi. Cette particularité lui permet de remonter des données actualisées sur le réseau routier à partir de dizaines de millions de véhicules partout dans le monde. HERE recueille également des données de plus en plus précises comme la sinuosité et la déclivité des tronçons de routes qui ont une influence sur les calculs des temps de parcours et l’autonomie des véhicules électriques.
Toutes ces évolutions enrichissent nos modèles de données et permettent à nos clients de faire des calculs toujours plus proches de la réalité à laquelle sont confrontés leurs collaborateurs sur la route.
Comment le Pôle Data a-t-il pris en compte la question des Jeux Olympiques et Paralympiques ?
Les perturbations de circulation liées aux Jeux inquiétaient beaucoup nos clients. Nous avons intégré dans nos graphes les restrictions associées aux épreuves sous forme de ‘reject flags’ et ce, dans toutes les zones concernées. Ces données font partie de la mise à jour du 2e trimestre qui sera disponible fin juin. Cette mise à jour tiendra compte de tous les cas de figure possibles, sachant que les restrictions et dérogations varient d’un jour à l’autre selon les sites et le calendrier des épreuves. Tous les utilisateurs auront accès à ces données, sans restriction. Pour calculer leurs tournées pendant toute cette période, il leur suffira de choisir le bon profil de véhicule et de cocher l’option JO dans leur logiciel. Quelques jours avant l’évènement, un avertissement sera envoyé aux clients par infos bulle pour les alerter des différentes perturbations prévues et faciliter la gestion des conditions de circulation. Le principe est le même que pour les ZFE, la seule différence est que ces dispositions particulières sont limitées à la durée des Jeux.
Répondez-vous à d’autres demandes particulières ?
Absolument. Entre 10 % et 15 % de l’activité du Pôle Data consiste en prestations de services pour des clients ayant des besoins spécifiques, récurrents ou non. Il s’agit de prestations sur mesure, par exemple le géocodage d’un million d’adresses au niveau le plus précis ou la normalisation de fichiers d’adresses de très mauvaise qualité. Certains clients font appel à notre expertise pour déterminer à quelle agence de leur réseau il est plus judicieux de rattacher chacun de leurs clients. D’autres nous demandent de créer leur sectorisation. Les demandes sont extrêmement variées. S’y ajoutent celles des équipes Avant-Ventes et des Professional Services pour qui nous expertisons et intégrons des données fournies par le client, ce qui nous conduit parfois à développer des fonctionnalités et des outils spécifiques.
Cependant, le cœur de notre activité reste tout ce que j’ai décrit depuis le début de cet entretien : l’intégration des données, leur actualisation et leur mise à disposition pour l’ensemble nos clients de façon à ce qu’ils puissent organiser leur propre activité en se fondant constamment sur les données les plus récentes et les plus fiables.