Data Mesh : décentraliser sans perdre la gouvernance

Data Mesh : décentraliser sans perdre la gouvernance

Jean-Emmanuel Orfèvre
Jean-Emmanuel Orfèvre
8 min
Data Mesh : décentraliser sans perdre la gouvernance

En bref

Domaines propriétaires, data as product, self-serve platform, gouvernance fédérée. Les 4 principes de Zhamak Dehghani appliqués en production.

Le Data Mesh n'est pas une architecture technique. C'est une transformation organisationnelle complète.

Imaginé par Zhamak Dehghani (Thoughtworks), il repose sur 4 principes : ownership décentralisé (chaque domaine métier propriétaire de ses données), data as product (traiter les données comme un produit avec SLAs), self-serve platform (plateforme centralisée facilitant l'accès autonome), et gouvernance fédérée (règles globales + autonomie locale).

Les organisations qui ont structuré le Data Mesh en 2026 sont 3-4x plus rapides à déployer nouveaux cas d'usage. C'est la transition majeure : du centralisé pur vers le fédéré pragmatique.

Les 4 principes en production

Principe 1 : Domain Ownership. Chaque domaine métier (ventes, marketing, logistique, RH) est propriétaire de ses données. Pas de centrale data qui force les structures. C'est un changement radical. La vente contrôle ses données clients. Marketing ses données de campagne. Responsabilité : qualité, accès, évolution.

Principe 2 : Data as Product. Les données ne sont pas des résidus techniques. C'est un produit avec un owner, un SLA, une documentation, une roadmap, des utilisateurs. Like any product : usability matters. Documentation critical. Support required.

Principe 3 : Self-Serve Platform. Une plateforme centrale (dbt, Dagster, data catalog, IDE) facilite l'accès autonome. Sans avoir à passer par une équipe data centrale pour chaque requête. Les utilisateurs self-service, mais guidés et gouvernés.

Principe 4 : Federated Governance. Règles globales + autonomie locale. Standards communs (définitions de métriques, classification des données) décidées collectivement. Mais chaque domaine décide comment les implémenter.

Le changement organisationnel majeur

Modèle centralisé (legacy) : une équipe data centrale gère tous les pipelines, toutes les transformations, toutes les demandes. Goulot d'étranglement : délais d'1-2 mois pour une nouvelle métrique.

Modèle Data Mesh : équipes domaines (ventes, marketing, RH) ont des analytics engineers décentralisés, propriétaires de leurs pipelines dbt, dans une plateforme partagée. Délais : 1-2 semaines.

L'équipe data centrale devient une plateforme : elle maintient l'infrastructure, définit les standards, aide les domaines à adopter les patterns. Pas exécute les requêtes.

C'est un changement de culture profond. De « data is our bottleneck » à « data is our enabler ». Durée transition : 12-18 mois pour une organisation taille moyenne.

Architecture technique du Data Mesh

Techniquement, quatre couches.

Couche 1 : Sources propriétaires. Chaque domaine gère ses sources (applications métier).

Couche 2 : Pipelines décentralisés. dbt projects domaine-spécifiques, orchestrés par Dagster/Airflow, déployés et versionnés dans Git. Chaque domaine responsibility : qualité, SLA, évolution.

Couche 3 : Data Products. Chaque domaine publie des data products - tables/datasets publiquement accessibles avec SLA, documentation, ownership.

Couche 4 : Self-Serve Platform. Catalog centralisé (Atlan, DataHub), IDE cloud (Hex, Mode), BI (Looker), qui permettent aux utilisateurs de découvrir et utiliser les data products sans friction.

Orchestration centralisée pour coordonner les dépendances cross-domaines.

Exemple : Data Product 'Customers' (Sales domain) utilisé par Marketing, RH, Analytics.

Data Products : traiter les données comme un produit

Un data product est plus qu'une table. C'est un produit data complet : table(s) source, transformations dbt, documentation, SLA, interface d'accès.

Chaque data product a : un Product Owner (business owner ou analytics engineer du domaine), une version, un changelog, une roadmap.

Exemple : Data Product 'Revenue Forecast' (Finance) - propriétaire : CFO adjoint, SLA : disponibilité 99.5%, latence <4h, version 2.3, changelog documenté, utilisateurs : pricing, sales ops, board.

Le Product Owner décide : quels champs inclure, quel schéma, quels tests, quel SLA. Les utilisateurs (Marketing, Sales) consomment via une API standard.

C'est une inversion de perspective. Pas « quelle requête voulez-vous ? » mais « quel data product vous intéresse ? » Focus sur l'usability. Pas sur la technique.

Gouvernance fédérée en action

La gouvernance fédérée équilibre autonomie et cohérence.

Règles globales (décidées collectivement, équipes + execs) : définition des métriques clés (CA, churn, NPS), standards de tagging, classification des données (public, confidentiel, restreint), SLA minimaux, cadence de reporting.

Autonomie locale : chaque domaine implémente ces règles comme il le souhaite. La Vente décide si elle utilise dbt ou Spark pour les transformations (l'important : elle respecte les standards de définition de CA). Finance décide comment elle structure ses data products (l'important : elle publie le chiffre d'affaires en accord avec la définition globale).

Instances de gouvernance fédérée : comité directeur data trimestriel, review board des data products mensuels, guild des analytics engineers (peer learning, best practices).

Les risques et comment les mitiger

Risque 1 : Fragmentation et incohérence. Sans gouvernance stricte, chaque domaine crée ses propres définitions, chiffres divergent. Antidote : Semantic Layer centralisé, définitions versionnées, audit régulier des incohérences.

Risque 2 : Surcharge opérationnelle. Laisser chaque domaine maintenir ses pipelines → double le travail ops. Antidote : Platform team solide (5-10 personnes) maintenant l'infra, l'outillage, les templates dbt.

Risque 3 : Résistance au changement. Les équipes data centrales perdent du pouvoir. Antidote : repositionner comme Platform Enablers. Reconnaître le travail.

Risque 4 : Dépendances cross-domaines non gérées. Le domaine B dépend du data product A, mais A change sans prévenir. Antidote : DAGs globaux dans Dagster, notifications de changements de schéma, contrats entre data products.

Commencer : d'un domaine pilote à la scalabilité

Ne pas tout basculer en Data Mesh d'un coup. C'est trop risqué.

Étape 1 : choisir un domaine pilote (souvent la Vente ou le Marketing). Créer une petite équipe : 1-2 analytics engineers, 1 Product Owner métier.

Étape 2 : identifier 3-5 data products clés pour ce domaine. Les définir, les mettre en production.

Étape 3 : former une Platform team centrale. Établir les standards.

Étape 4 : prouver la valeur avec le domaine pilote. Montrer les délais réduits, la qualité améliorée, l'autonomie métier.

Étape 5 : scaler à d'autres domaines progressivement. 1 nouveau domaine tous les 2-3 mois.

Le timeline : 12-18 mois pour avoir 3-4 domaines en Data Mesh productif. Puis scaler les domaines restants.

Le ROI du Data Mesh

Les organisations qui adoptent le Data Mesh rapportent :

Vitesse : délais réduits de 80% pour nouvelles initiatives data.

Autonomie : métiers créent leurs propres analyses sans attendre l'équipe data.

Qualité : responsabilité claire, chaque domaine propriétaire de sa data quality.

Innovation : les domaines itèrent rapidement, testent, apprennent.

Et culturellement : la data devient une responsabilité partagée, pas une bottleneck centralisée.

En 2026, c'est viable pour les orgas taille moyenne+

Le Data Mesh n'est plus expérimental. C'est une approche viable pour les organisations taille moyenne+.

Les bénéfices - vitesse, autonomie, pertinence métier - compensent la complexité organisationnelle.

L'transition est un marathon, pas un sprint. Commencer par un domaine pilote. Prouver la valeur. Puis scaler.

Les organisations qui font ce chantier en 2026 seront 3 ans d'avance sur celles qui attendent 2028.

Donc. Data Mesh n'est pas idéal. C'est pragmatique. C'est fédéré. C'est opérationnel.

Et c'est l'avenir de la gouvernance data en production.

Poursuivre votre exploration

Découvrez d'autres articles de Data Strategy de l'univers Data

Articles recommandés

Ce sujet vous intéresse ?

Nos experts peuvent approfondir ce thème lors d'un échange dédié. Prenez rendez-vous pour en discuter.

Discuter avec un expert →