Bomzai › Insights › Cas clients
Data lineage automatisé end-to-end
Contexte
Producteur d'énergie (4 500 employés, 2,5 Mds€ CA). Exigences de traçabilité des données renforcées par le régulateur (CRE) et les auditeurs. Aucun data lineage en place : impossible de tracer l'origine, les transformations et la destination des données réglementaires. Audit à risque. Le client a déjà eu des expériences décevantes avec des cabinets classiques.
Problème & Défi
– Aucun data lineage. impossible de répondre aux questions du régulateur sur l'origine des données – Audit CRE à risque : traçabilité des données réglementaires exigée et non démontrable – 300 pipelines data sans documentation, 15 data engineers ne peuvent pas expliquer les transformations – Impact analysis impossible : chaque modification de schéma peut casser des pipelines en aval sans prévenir – Conformité RGPD fragilisée : impossible de tracer le parcours des données personnelles – Temps de debugging des erreurs data : 4h en moyenne faute de lineage
Solution & Livrables
Data lineage automatisé end-to-end livré et opéré (OpenLineage + Databricks Unity Catalog) Traçabilité complète de 300 pipelines : origine, transformations, destinations – documenté automatiquement Conformité CRE et RGPD atteinte → lineage auditable par le régulateur et les CAC Impact analysis automatique : chaque modification de schéma génère une analyse d'impact en aval Temps de debugging ramené de 4h à 20min grâce à la visualisation du lineage Documentation vivante des pipelines → mise à jour automatique à chaque modification