Architecture Médaillon : la structure data qui garantit qualité et traçabilité

Architecture Médaillon : la structure data qui garantit qualité et traçabilité

Antoine Lesparre
Antoine Lesparre
8 min
Architecture Médaillon : la structure data qui garantit qualité et traçabilité

En bref

Bronze-Silver-Gold : la structure organisationnelle la plus éprouvée pour garantir qualité, traçabilité, et scalabilité.

72% des organisations qui font sérieusement de la data en 2026 utilisent l'architecture médaillon. Ce n'est pas un hasard.

C'est pas juste une architecture technique. C'est un cadre organisationnel qui change comment on pense à la qualité, à la traçabilité, à la responsabilité des données.

Bronze : données brutes. Chargées telles quelles, avec métadonnées de chargement. Zéro transformation.

Silver : données nettoyées, enrichies, contrôlées en qualité. Prêtes pour l'analyse métier.

Gold : données d'affaires finales, modélisées, agrégées. Prêtes pour la consommation BI.

Cette structure garantit : traçabilité complète (on sait d'où vient chaque donnée), qualité progressive (chaque couche ajoute du contrôle), et scalabilité sans explosion de coûts.

Les trois couches et leurs responsables

Bronze (couche brute) : les données arrivent du pipeline ELT (Fivetran, Airbyte) sans transformation. Chaque fichier Parquet inclut des métadonnées : timestamp d'arrivée, source, hash du fichier, version du schéma. Aucun nettoyage. Propriétaire : les data engineers. Avantage : tracabilité totale. Si quelque chose s'est mal passé, on peut rejouer depuis la source.

Silver (couche propre) : dbt transforme les données Bronze en Silver - suppression des doublons, validation des types, normalisation des dates, enrichissements standards, ajout de clés métier. Chaque table Silver est testée (uniqueness, not null, referential integrity). Propriétaire : les analytics engineers. Avantage : une seule source de vérité pour les transformations. Tout est versionnée dans Git.

Gold (couche métier) : Silver vers Gold ajoute la modélisation métier - tables d'affaires finales, agrégations, calculs de KPI, dimensions conformées. C'est ce que les utilisateurs BI voient. Propriétaire : métiers (avec support data). Avantage : pas d'analysts qui créent des tables adhoc. Tout passe par la gouvernance.

Cette répartition crée naturellement des couches de gouvernance. Ops contrôlent Bronze. Équipe data gère Silver. Métiers valident Gold.

Qualité exponentielle

La qualité des données augmente exponentiellement à chaque couche.

Bronze : 0% de contrôle. Données brutes acceptées.

Silver : tests dbt systématiques (null checks, unique keys, value ranges, referential integrity). La qualité monte.

Gold : validation métier supplémentaire (cohérence inter-tables, business logic). C'est une couche supplémentaire de sécurité.

Résultat : 85% moins d'erreurs de data quality comparé à une architecture plate où tout est mélangé.

Traçabilité bidirectionnelle

Forward : d'où vient cette donnée ? Quelle table source, quel champ, quelle transformation ?

Backward : quel impact si je change cette transformation ? Quelles tables Gold en dépendent ?

dbt Data Lineage intègre nativement cela. Les utilisateurs BI voient l'arbre complet Bronze → Silver → Gold pour chaque métrique. C'est transparent. C'est traçable. C'est auditable.

Implémentation : dbt + Delta Lake ou Iceberg

L'architecture médaillon se concrétise élégamment avec dbt + Delta Lake ou Iceberg.

dbt crée les trois couches de modèles : staging (Bronze → Silver), intermediate (agrégations), mart (Silver → Gold). Chaque modèle est documenté, testé, versionné dans Git.

Delta Lake (Databricks) ou Iceberg (Snowflake, BigQuery) gèrent le stockage : support ACID, time-travel (rejeu aux dates antérieures), schema evolution automatique.

Orchestration via Dagster/Airflow pour coordonner les dépendances.

Exemple concret : données de ventes arrivent en Bronze (partitionnées par date). dbt crée une table Silver_sales_clean (dédupliquée, typée). Puis une table Gold_daily_revenue_by_region. Si une erreur est détectée le jour 10, on rejoue depuis Bronze sans perte.

Cette implémentation coûte 50% moins cher qu'une approche manuelle en Spark/PySpark.

Gestion des historiques et évolutions de schéma

Contrairement aux bases transactionnelles, les data warehouses doivent conserver l'historique complet.

Le médaillon simplifie cela : Bronze garde tout (historique immutable). Silver ajoute des timestamps de début/fin pour les dimensions changeantes (Slowly Changing Dimensions type 2). Gold gère les agrégations et les snapshots.

Exemple : une table Client en Silver enregistre quand une adresse change (start_date, end_date). Gold agrège les ventes par client actuel.

Delta Lake et Iceberg gèrent élégamment l'évolution du schéma : nouvelles colonnes acceptées, colonnes supprimées versionnées. Cela réduit les pipelines de migration qui consomment 30-40% du temps ops dans les architectures legacy.

Scalabilité sans explosion de coûts

Le médaillon crée des économies d'échelle naturelles.

Bronze : stocke tout (volumineux, bon marché - $0.02/GB/mois dans S3).

Silver : filtré, compressé, réduit de 30-50% comparé à Bronze (nettoyage, dédupliques).

Gold : agrégé, encore 50-70% plus petit que Silver.

Avec Snowflake/BigQuery, seul le Gold est souvent chargé en cache rapide. Bronze/Silver restent en objet storage (100x moins cher).

Résultat : scaling quasi illimité sans explosion de coûts. Une pipeline de 10 TB Bronze génère 5-7 TB Silver, 1-2 TB Gold. Coût total : 5-10x moins cher qu'une DW traditionnelle.

Culture data : comment on s'organise

Le médaillon n'est pas qu'une architecture technique. C'est un cadre organisationnel qui force une bonne culture data.

Bronze gérée par les data engineers (pipelines, qualité de chargement). Silver gérée par les analytics engineers (transformations, tests, documentation). Gold gérée conjointement avec les métiers (modélisations, agrégations, KPI).

Cette répartition des responsabilités crée une culture data saine :

Les métiers ne peuvent pas bricoler des requêtes ad hoc : ils utilisent des tables Gold gouvernées. Les erreurs d'une table Silver n'impactent pas Bronze. Et les données brutes restent immédiatement rejoignables pour investigation.

72% des organisations adoptant le médaillon rapportent une amélioration majeure de la culture data. Parce que les responsabilités sont claires. Parce que la traçabilité est totale. Parce que la qualité s'améliore progressivement.

Commencer maintenant

Le médaillon n'est pas une architecture avancée réservée aux matures. C'est la fondation d'une culture data bien menée.

Traçabilité. Qualité. Scalabilité. Tout s'améliore quand les données transitent par Bronze-Silver-Gold.

Les organisations qui l'adoptent dès maintenant seront des années d'avance. En 2026, c'est pas optionnel. C'est la baseline pour opérer en production.

Poursuivre votre exploration

Découvrez d'autres articles de Data Engineering de l'univers Data

Articles recommandés

Ce sujet vous intéresse ?

Nos experts peuvent approfondir ce thème lors d'un échange dédié. Prenez rendez-vous pour en discuter.

Discuter avec un expert →