Pramana
7 mars 2023 Back To Basics #Data #Catalogue de Données

Qu’est-ce qu’un catalogue de données et pourquoi en avez-vous besoin ?

Pramana

Hors de la data, point de salut ! C’est elle qui va en effet permettre de créer, maintenir et faire évoluer les services d’une entreprise. Mais pour mettre en place un data management efficient, il faut commencer par la base : identifier, qualifier, et rendre accessible aux métiers vos données. Donc partir d’un catalogue de données.

La donnée est partout. Dans nos sphères personnelles et professionnelles, nous en générons, nous en exploitons, nous nous accordons sur le fait qu’elle doit donner à nos entreprises un avantage concurrentiel décisif. Le phénomène de « digitalisation » de l’économie (terme auquel nous préférons le plus correct « numérisation ») explique en grande partie pourquoi la donnée est devenue l’une des grandes obsessions des organisations.

La numérisation de l’économie, et de la société de façon en général, entraîne en effet une explosion des données. Chacune de nos interactions numériques crée des informations, et leur traduction informatique. Ces données sont nécessaires à la création, au maintien et à l’évolution des nombreux produits et services numériques que nous utilisons au quotidien.

Les épouvantails GAFA allument la mèche

Responsables aussi de cet intérêt renouvelé pour la data : les géants des nouvelles technologies, qui ont bâti leur succès sur leur capacité à capter, interpréter, et exploiter les données (coucou, les GAFA !). Leur toute-puissance, et leur appétit vorace, obligent aujourd’hui toutes les entreprises à s’adapter, à revoir des stratégies traditionnelles chamboulées par ces nouveaux concurrents… et donc à se pencher sur leurs propres données.

La réglementation accélère les projets data

Si l’on ajoute à cela un contexte réglementaire en constant durcissement, et ayant en plus tendance à empiler les couches, on voit bien le tableau qui se dessine.

Il y a encore quelques années, un chef d’entreprise pouvait esquisser un sourire en coin à l’écoute de termes tels que « Data Strategy », Stratégie « Offensive » ou « Défensive » (voir Figure 1) personne ne rit plus. Ces stratégies « Data-X » apparaissent de moins en moins comme des options, des fantaisies, voire des fumisteries. Mais comme une nécessité pour survivre.

Figure 1 : Data Strategies — Source: Harvard Business Review

Les fonctions et les rôles se sont multipliés

Dans ce contexte, divers projets, programmes et études sur la Data se multiplient, de nouveaux rôles et acronymes s’invitent dans le langage de l’entreprise avec les Chief Data Officers (CDO), Data owners, Data Stewards… Et de nouvelles structures organisationnelles se mettent à pousser : Data labs, Data Factories, Data Governance boards, et tout autre nom composé commençant par le désormais sacro-saint terme « Data ».

Ces équipes et ces structures s’attaquent à des chantiers aussi vastes que complexes : Master Data Management, gestion de la qualité, nouvelles technologies de stockage, exploitation de la donnée…

Pourtant, une question essentielle taraude encore nombre de CDO : comment avoir une visibilité sur mon patrimoine de données, et le rendre partageable et exploitable ? C’est à cette question que doit répondre le catalogue de données.

La donnée est une notion complexe à appréhender, et pour faciliter sa compréhension et sa documentation, une bonne pratique est de distinguer deux termes qui correspondent en réalité à deux manières d’appréhender et de documenter la donnée : le « Glossaire métier » et le « Dictionnaire de données ». La combinaison de ces deux éléments constitue ce que l’on nommera ici le « catalogue » de données dans sa globalité.

Figure 2 : Structure simplifiée d’un catalogue de données

Le glossaire : les données du point de vue métier

Le Glossaire Métier s’attache à décrire les données du point de vue des métiers. Il consiste donc à décrire les informations manipulées pour réaliser toutes les activités d’une organisation, avec une préoccupation majeure sur la sémantique de ces informations (quel est leur sens ?). Car c’est toujours utile de savoir de quoi on parle et ce que l’on manipule…

En effet, dans un contexte omnicanal avec de multiples « consommateurs » (dans l’entreprise) de la même donnée, il faut s’assurer d’une compréhension commune afin d‘éviter un « quiproquo » entre ces consommateurs !

Le glossaire vise également à donner certaines indications permettant de faciliter la gestion d’une donnée :

  • Est-elle « clé » ?
  • Est-elle à caractère personnel ?
  • Est-elle sensible ?
  • Etc.

Le dictionnaire : les données vues des SI

Le Dictionnaire de données décrit quant à lui les connaissances sur les données dans chaque système à un niveau que l’on peut qualifier de « technique », c’est-à-dire au niveau des systèmes informatiques. Il consiste donc à recenser les implémentations de ces informations dans l’ensemble des systèmes de l’organisation : quelle application manipule telle donnée ? Quelle est sa structure ?

Réunis, le Glossaire métier et le Dictionnaire de données ont pour but commun de documenter, gérer et diffuser la connaissance sur les données de l’entreprise. Voilà pour la théorie.

Catalogue des données : de la théorie à la pratique

Mais dans la pratique, comment fait-on ? C’est effectivement là que les choses se compliquent.

Une fois que le CDO ou chef de projet s’est mis d’accord sur le périmètre et les définitions, les questions qu’il doit adresser sont les suivantes :

  • Comment initialiser ce référentiel ?
  • Et comment le faire vivre, et le pérenniser ?

Des ouvrages de référence, tels que le Data Management Body of Knowledge (DMBoK) donnent des indications précieuses pour répondre à ces questions. Mais ces pistes sont malheureusement assez génériques…

Romain Paoletti
Consultant Data