Pramana
21 janvier 2022 Pramanews #Data #Evénement

Retour de la Conférence DGIQ 2021

Des convictions éclairantes de leaders d’opinion sur la gestion des données

Pramana

J’étais, du 6 au 10 décembre dernier à San Diego, en Californie, où se tenait la conférence Data Governance & Information Quality (ou conférence DGIQ). J’ai participé à plusieurs sessions et ai eu la chance d’interviewer quelques-unes des célébrités de l’évènement. Je reviens dans cet article sur les points de vue marquants que j’ai entendus durant ces quelques jours.

Et pour leur faire honneur, merci à Sue Gueuens, Danette McGilvray, John Ladley et Scott Taylor pour leur temps et leurs précieux retours d’expérience lors des interviews.

Leçon n°1 (la plus importante à mes yeux) — Ne restez pas bloqués ! Soyez proactifs et construisez une vision et une feuille de route data en lien avec les objectifs métiers.

“Celui qui a un “pourquoi” qui lui tient lieu de but, de finalité, peut vivre avec n’importe quel “comment”. Friedrich Nietzsche

C’est à travers ce genre de citation que Scott Taylor, le plus drôle des leaders d’opinion sur le Data Management, développe sa pensée. Il pointe ici l’impérieuse nécessité pour un Data Office d’exprimer haut et fort sa vision pour justifier les actions qu’il va mettre en œuvre.

Introduction de la présentation de Scott Taylor pendant la conférence DGIQ 2021

Il est rejoint en ce sens par John Ladley, auteur et praticien réputé de la Gouvernance des Données, qui formule une injonction similaire. La méthode qu’expose Ladley est simple (et pourtant rarement appliquée) : identifier les objectifs métiers et les capacités métiers qu’ils requièrent. Par la suite déduisez-en les capacités liées à la gestion des données (ex: avoir des indicateurs de qualité des données). Une fois cette vue d’ensemble définie : mettez-là en œuvre.

L’exposé de John Ladley intitulé « Little g, big G » est également revenu sur cette tendance mortifère de certains Data Offices à ne traiter que des cas d’usages spécifiques (des activités « little g ») sans chercher à développer la vision d’ensemble (ou la « big G ») qui apporte de la cohérence à ces actions localisées. En effet, on constate qu’un accompagnement par cas d’usage ne favorise pas une augmentation de la maturité face aux données, il n’arrange que localement les responsables du projet.

Enclencher cette activité de construction d’une stratégie n’est pas une tâche aisée. D’autant qu’elle n’est utile qu’à la condition que le Chief Data Officer ait la liberté d’agir en ce sens et qu’il ait suffisamment de temps. C’est John Ladley qui a relevé ce point : tant que le CDO se trouve sous le DSI, il est principalement voué à être un administrateur de donnée et à agir en réaction face aux résultats d’audit et crises de sécurité. Pour souligner ce point, il cite une étude à paraître d’Infonomics montrant qu’une organisation positionnant un CDO à égalité avec le reste de l’équipe dirigeante et en le dotant de moyens d’agir, atteint de meilleurs résultats que les autres.

Enfin, selon John Ladley, la Gouvernance des Données (au même titre que d’autres projets particulièrement transversaux) requiert une approche top-down, avec un soutien au plus haut niveau. Il en va ainsi pour des projets tels que la mise en conformité avec le RGPD ou de la mise en place d’un ERP qui nécessitent une collaboration large et n’apportent pas de bénéfices immédiats.

Ainsi, définissez où vous souhaitez aller et atteignez capacité par capacité votre vision, en ne cessant jamais de vous référer au pourquoi de votre plan. Pour citer John Ladley : « ce n’est pas par la bonté naturelle de l’humanité que cela adviendra, vous devez être proactif ».

Leçon n°2 — Actrices et acteurs de la Data Science : embrassez-le Data Management !

L’un des moments très attendu de la conférence était l’intervention de Scott Taylor sur la pensée des philosophes au service du Data Management : “Truth before meaning”, la vérité, puis le sens. À partir de citations d’illustres philosophes, il déroule sa pensée : s’entendre sur ce qui est vrai, c’est à dire la réalité (ce qui, pour l’analogie, est l’œuvre du Data Management) est le préalable à la recherche de sens que promet l’analytique avancée.

Chaque aspect du Data Management comporte des bonnes pratiques utiles aux Data Scientists

Apparus depuis quelques temps à présent, les Data Analysts, Data Scientists et toutes les personnes travaillant sur la valorisation des larges volumes de données, ont grandement contribué à la promotion de la gestion et l’exploitation des données. En revanche, les speakers que j’ai rencontrés m’ont tous partagé leur étonnement de ne pas être plus souvent sollicités par ces professionnels pour traiter leurs problèmes liés à la gestion des données. Sue Gueuens, ancienne présidente de DAMA International, met directement en cause l’absence de maturité et de mise en pratique d’une Gouvernance des Données.

Exemple, à la citation classique du Data Scientist qui constate passer 80% de son temps à nettoyer les données, deux enseignements peuvent en être tirés :

  • Il aurait tout intérêt à tirer parti des méthodologies éprouvées des praticiens de la gestion de la qualité des données pour effectuer ces actions si chronophages
  • La valeur ajoutée du Data Scientist porte en grande partie sur du nettoyage de données. Cela illustre le besoin critique d’avoir des ressources conséquentes dédiées à la gestion de la qualité des données

Aussi, plutôt que de recréer hors sol des données, Scott Taylor leur prodigue ce conseil éclairé : les fondamentaux du Data Management vous permettraient d’alimenter vos modèles à partir de meilleurs entrants, et seraient opérationnels plus rapidement car alignés avec la réalité des acteurs métiers (en termes d’identifiants utilisés, de géographie, de taxonomie par exemple).

En fin de compte, une confusion s’est installée : lorsque l’on parle de « data », les yeux s’illuminent en imaginant Intelligence Artificielle, Machine Learning, etc. Or la réalité est que la Gouvernance des Données, la gestion de la qualité et des données de référence sont nécessaires à la création de modèles analytiques avancés. Et Scott Taylor d’insister en constatant que ce message n’atteint que trop rarement le top management.

Face à cet impératif d’immédiateté, Sue Gueuens recommande de reprendre sa respiration et d’identifier ce qu’on cherche à atteindre plutôt que de tordre les données pour obtenir le résultat attendu par le top management, car ce n’est pas le but d’un « scientifique » de la donnée.

En conclusion, que vous soyez du côté du Data Management ou de la Data Science, provoquez cette rencontre (le mieux étant que ces deux pôles soient ensemble au sein d’un Data Office) et ce travail commun, vous pourrez ainsi faire émerger une chaîne de valeur intégrée de la donnée.

Leçon n°3 — La Qualité des données ne se résume pas à de la correction et des tableaux de bords

Sur cette semaine de conférence, j’ai eu l’occasion de passer deux journées de séminaire avec Danette McGilvray, autrice d’un livre de référence sur la qualité des données : Executing Data Quality Projects: Ten Steps to Quality Data and Trusted Information TM, 2nd Ed. (Elsevier/Academic Press, 2021), qu’elle a parcouru en ponctuant de mise en pratique à partir de cas concrets partagés par la quinzaine de participants.

Couverture de la seconde édition du livre de Danette McGilvray

D’entrée de jeu, il est évident que son approche est organisationnelle, et non orientée outils. C’est pourquoi elle fait la part belle à l’analyse des impacts pour le métier d’une donnée de mauvaise qualité, et à l’identification de la source d’un problème. Lors de notre entretien, elle est revenue sur l’importance de se greffer à des programmes critiques pour le métier (ex : déploiement d’ERP) et d’y démontrer toute la valeur qu’une gestion de la qualité lui apporte.

De plus, elle se montre sceptique vis-à-vis de l’utilité du tableau de bord s’il est utilisé comme unique manière de traiter la qualité des données dans l’entreprise : ce n’est qu’un outil. Comme elle l’expose, “je ne souhaite pas travailler sur un tableau de bord, à moins que les parties prenantes soient prêtes à prendre des décisions et agir à partir des indicateurs de celui-ci”.

Enfin pour ceux qui seraient suffisamment matures dans leur gestion de la qualité des données : Danette McGilvray recommande de travailler sur le storytelling. En effet, pointer les faiblesses et expliquer de façon rationnelle les bénéfices ne suffisent pas à convaincre. A la façon d’un Scott Taylor, pour convaincre et embarquer vos interlocuteurs, il faut enrober ce discours factuel d’émotions, de buts, de « saveurs » en combinant anecdotes et chiffres de façon construite.

En synthèse

Ces quelques jours passés à San Diego pour la conférence DGIQ m’ont permis de prendre de la hauteur et de confirmer notre message chez Pramana à l’adresse des praticiens de la donnée : parlez la langue du métier, reliez votre démarche aux objectifs des responsables métier et montrez-leur de façon opérationnelle ce que le Data Management peut leur apporter.

Vincent Thorette
Consultant Data