Pramana
2 mai 2023 Pramanews #Data #Gouvernance des Données

Feedbacks sur la conférence Enterprise Data World 2023

Retours et opinions de nos consultants sur plusieurs interventions

Pramana

A la fin du mois de Mars vient de se tenir un des évènements majeurs de la communauté Data, j’ai nommé la conférence “Enterprise Data World (EDW) 2023″ : du 27 au 31 mars, ce ne sont pas moins de 60 conférences dispensées par 73 intervenants qui se sont tenues, sur des sujets variés et au centre des besoins des acteurs du domaine. Faute de place et de temps, il n’est pas possible de vous résumer l’ensemble des conférences auxquelles nos consultants ont assisté, nous avons donc décidé de vous partager un rapide (bien que tardif) retour d’expérience sur quelques-unes des interventions les plus marquantes de ce salon. A noter que toutes les sessions du 28 & 29 Mars sont accessibles gratuitement en replay !

Le parti-pris de Geoffroy

Parmi les différentes conférences visionnées, j’ai fait le choix d’en retenir 3 ayant la particularité, outre le fait d’être très instructives, de raisonner avec mon article publié récemment sur la nécessaire mais difficile collaboration entre Data Office et Data Factory. Point de volonté d’auto-promotion, voyez-y plutôt la continuité de mon attachement à garantir une collaboration optimale entre Métiers, Projets Data et Data Office.
Je ne saurais donc que trop vous recommander la lecture initiale de cet article avant de visionner les conférences sommairement résumées ci-dessous.

  • “Agility vs. Governance: Finding the Balance” par Vanessa Lam :
    Clairement la session la plus dynamique et attractive : dans cette présentation d’une cinquantaine de minutes, Vanessa Lam revient sur le dilemme « Gouvernance ou Agilité » touchant de nombreuses entreprises ne sachant comment garantir à la fois le respect des principes et bonnes pratiques du Data Management, avec la nécessité de délivrer régulièrement et rapidement des services et produits data pour les métiers. Bien souvent, la focalisation sur un seul de ces axes engendrant plus de problèmes que de bénéfices.

Présentation d’archétypes d’organisation de Data Governance en entreprise (capture de slide présentée par Vanessa Lam)

Pour faire face à ce problème bien connu, Vanessa Lam propose plusieurs pistes parmi lesquelles l’adoption d’une gouvernance de données fédérée, soit à mi-chemin des modèles centralisé et décentralisé.
Plus intéressant encore, l’intervenante présente alors 2 retours d’expérience concrets vécus en mission, chaque situation ayant nécessité d’adapter le modèle fédéré aux besoins et au contexte du client : le 1° exemple concerne une organisation très centralisée avec une équipe de Data Officers débordés ; le 2° exemple donnant à voir l’exact inverse, soit une organisation data très (trop ?) démocratisée avec tous les impacts (positifs et négatifs) que cela génère. L’illustration de l’importance des relais que peuvent être les « centralized partners » et les « democratized representatives » est des plus intéressantes sur la façon pour un Data Office d’interagir avec les projets data et avec les data stewards existants.
Ne pouvant m’appesantir sur cette conférence, je suis contraint de rester très synthétique et de vous renvoyer au replay, mais clairement une conférence valant la peine d’y consacrer du temps.

  • “Data Observability – What Is It and Why Is It Important?” par Mike Ferguson :
    Je serai bien plus bref pour résumer cette seconde conférence, celle-ci renouvelant moins son sujet, tant dans son fond que dans sa forme.
    Toutefois, la présentation de Mike Ferguson mérite largement d’être écoutée tant l’intervenant dresse une description concrète et complète de ce qu’est la data observability. Alternant explications théoriques, illustrations par l’exemple et retours d’expérience, cette conférence nous permet de mieux percevoir en quoi cette discipline est amenée à se développer et s’imposer dans la plupart des organisations dans les années à venir. La multiplication des applicatifs, des pipelines et des plateformes de gestion des données rend, de fait, indispensable la mise en place de mécanismes performants et automatisés pour déceler et traiter au plus tôt toute anomalie relative à un flux de données.
    Last but not least, au cours de sa démonstration Mike Ferguson ne manque pas d’établir de multiples parallèles de l’observabilité des données avec des sujets clés tels que : le principe Data Mesh et un de ses piliers qu’est le concept « Data as a Product » ; l’importance de la documentation et du catalogage des données pour obtenir une observabilité cohérente et réactive.
    Ces thématiques résonnent totalement avec les situations rencontrées avec les projets data que j’accompagne en tant que Data Officer : les besoins data des projets nécessitent bien souvent d’en revenir aux fondamentaux du Data Management, charge à moi d’être agile et de savoir systématiquement démontrer à mes interlocuteurs les bénéfices qu’ils obtiendront dans des initiatives telles que la data observability, la constitution de data dictionaries ou encore via la modélisation des données. Tout un programme !

Prérequis incontournables pour gérer des flux de données complexes dans les entreprises en 2023 (capture de slide présentée par Mike Ferguson)

  • “Data as a Product” par un panel de plusieurs intervenants:Avec trois intervenants en plus du médiateur, voilà une conférence qu’il est encore plus complexe de vous résumer en quelques lignes. Pour faire court, lors de cette session, les invités reviennent et échangent sur des questions telles que : comment définir et différencier « Data Product » et « Data as a Product » ? Est-il indispensable d’appliquer la méthode Agile pour être en mode « Data as a Product » ? (Spoiler : non !) Quelle applicabilité des concepts de SLA/SLO/SLI sur des produits data ? Comment définir et appliquer avec succès ownership et accountatbility sur des data products ? Quels indicateurs et métriques mettre en place pour convaincre, légitimer et développer vos Data Products ? Etc.Je ne saurais que trop vous recommander de regarder le replay de cet atelier afin de voir les retours détaillés des intervenants sur ces questions majeures. Pour ma part, j’y ai trouvé des réponses ou des confirmations à des interrogations que je pouvais me poser jusque-là, à propos de ce concept « Data as a Product » pouvant paraitre fumeux de prime abord (et de fait il peut l’être si appliqué juste par suivisme ou sans raison légitime).
    Avec de plus en plus d’organisations souhaitant appliquer la démarche Data Mesh, ce genre d’intervention est des plus instructives, à tout le moins pour acquérir une connaissance plus que superficielle de ce sujet plus que tendance.

L’avis de Jean-Yves

La possibilité de s’imprégner des dernières tendances, des nouvelles directions et opportunités mais également des nouveaux challenges autour de plusieurs thèmes tels que la gouvernance, la stratégie, l’architecture etc apporte un véritable intérêt à participer à ce type d’évènement. Et cela à un niveau mondial.

C’est pourquoi j’ai porté mon attention sur quelques conférences portant une vision prospective tout autant que pragmatique, et pour lesquels je vous partage ici mes différents retours :

  • “Top Data Priorities in 2023” par un panel de plusieurs intervenants:

Les échanges des différents intervenants ont porté sur les priorités en matière de données en 2023, notamment sur les nouveaux enjeux, les facteurs de succès critiques, la justification de la gestion et de la gouvernance des données, ainsi que sur les technologies émergentes comme l’IA générative (ChatGPT s’est invité dans l’actualité brûlante de ce premier trimestre 2023) et la blockchain.

En résumé, le début de l’année 2023 est marqué par de nombreuses pressions externes, en particulier économiques, mais également de nouvelles opportunités technologiques (Data Lake House, Data Mesh, ChatGPT), obligeant au sein de chaque organisation de s’assurer de l’alignement stratégique de la gouvernance des données avec la stratégie de l’entreprise et les partenaires externes. Cet alignement doit être mesuré afin de démontrer la valeur apportée par cette gouvernance des données, et de s’assurer que la valeur peut être délivrée sur différentes échelles de temps.

Si cela est vrai pour la rentabilité, il ne faut pas négliger la partie investissement pour autant, notamment par l’acculturation des différents acteurs et de la communauté autour des pratiques de la donnée, et du changement organisationnel qui peut en découler, en s’assurant d’avoir les bonnes personnes avec les bonnes responsabilités.

Cette base est nécessaire pour consolider l’existant et préparer l’innovation par un pilotage éclairé, en particulier par l’application de l’IA tout au long de la chaine de traitement de l’information, et par une priorisation des données à gérer.

 

  • “Communicating the Value of Data Governance” par un panel de plusieurs intervenants

Comment démontrer et communiquer sur la valeur apportée par une gouvernance des données ? Voilà certainement l’un des sujets majeurs de cette année 2023, au regard des précédents échanges de la session “Top Data Priorities in 2023”. Cela a été l’occasion pour trois intervenants de partager leurs expériences dans la définition de métriques pertinentes, des exemples concrets de calcul, et d’une communication efficace de la valeur des différentes activités de gouvernance data au sein de l’organisation.

Après un juste rappel sur les attentes des décideurs concernant les données de l’entreprise, de la compréhension du passé jusqu’à l’analyse prédictive, il nous est rappelé l’importance de la maturité dans la gouvernance des données.

Et bien entendu, le pilotage de cette maturité de gouvernance doit être mesurée sur les bénéfices obtenus comme le démontre l’illustration suivante :

Exemples de métriques associées aux résultats de la stratégie des données (Capture de slide présentée par Mark Milone)

La mesure de ces bénéfices obtenus repose sur les processus de 4 volets que sont le stewardship des données, la découverte des données, la facilité d’accès aux données, et la compréhension des données utilisées.

Afin d’avoir une vision plus détaillée des métriques citées en exemple, la visualisation de cette session en replay vous permettra d’identifier les plus pertinentes à vos besoins.

  • “How to Produce an Open and Integral Data Strategy with a Pragmatic Method” par Marilu Lopez

Lors de cette session, Marilu Lopez, nous a présenté la méthode PAC (Pragmatique, Agile et Communicable) pour produire des stratégies data, de l’importance d’un modèle de maturité data management en tant qu’ancrage pour une stratégie data, et le pouvoir d’un cadre type pour communiquer cette stratégie.

Les trois grandes étapes de cette approche PAC sont les suivantes :

  1. L’utilisation d’un cadre pour les stratégies des données garantissant l’alignement sur la stratégie de l’entreprise.
  2. L’application d’un ensemble de cadres de stratégie des données définis par les parties prenantes.
  3. Le cycle de la stratégie des données.

Exemple de cadre sur l’alignement stratégique des données (Capture de slide présentée par Marilu Lopez)

Les différents cadres proposés par Marilu Lopez se révèlent particulièrement efficaces, dans l’ordre précis d’utilisation de ceux-ci, chacun étant un prérequis pour le suivant pour capturer les besoins et faciliter l’usage. C’est ce que nous pouvons voir de manière synthétique dans son cycle de la stratégie des données présenté ci-dessous :

Le cycle de la stratégie des données (Capture de slide présentée par Marilu Lopez)

La proposition portée par Marilu Lopez est suffisamment générique pour que chacun puisse s’approprier la méthode et la contextualiser à ses besoins propres. Je vous recommande vivement de visualiser la démonstration de cette démarche pragmatique dans le replay disponible sur la plateforme de la conférence EDW 2023.

Conclusion et ouverture

Au moment de conclure, quelle synthèse tirer de ces 6 conférences aux thématiques si variées ? Tout d’abord peut être, le fait que ces enjeux, bien que tous distincts, sont pour autant tous connectés. De fait, on ne peut imaginer travailler sur l’opérationnalisation de la Gouvernance des données auprès de Data Products sans aborder l’observabilité des données, sans se tenir au fait des tendances de fonds en matière de data et d’architecture SI. Idem, il n’est pas possible de définir une stratégie Data sans imaginer en même temps la valeur et le ROI apportés par un programme de Data Governance. Il est indispensable de se maintenir en permanence au courant des nouveautés et de l’état de l’art de ces disciplines, c’est pourquoi nous invitons nos clients, partenaires ainsi que nos consultants, à maintenir cette veille constante que ce soit via les articles (internes et externes) que nous partageons régulièrement, en se formant mais aussi en assistant autant que possible aux conférences de référence sur nos sujets. C’est ainsi que nous profitons de cette synthèse en décalée de la conférence EDW2023 pour vous recommander d’assister du 9 au 12 Mai 2023 aux conférences «Data Governance Conference Europe » et « Master Data Management Conference Europe ».  Les intervenants et les sujets abordés sont riches d’enseignements pour nos activités, à nous d’en profiter !

Geoffroy Escard
Consultant Data
Jean-Yves Herpet
Consultant Data