Combien de fois le chiffre d'affaires présenté par le marketing diffère-t-il de celui de la finance ? Vous pouvez arrêter de compter.
Selon Atlan, 73% des organisations souffrent d'incohérences entre les métriques. Le même KPI, calculé trois fois différemment selon la direction, le filtre temporel, le périmètre géographique. Chaque équipe a sa propre définition. Ses propres filtres. Ses propres périmètres.
Le coût ? Énorme. Heures perdues en réconciliation. Décisions basées sur des chiffres faux. Perte totale de confiance dans la data.
Le Semantic Layer résout ce problème en centralisant les définitions dans une couche unique, versionnée, gouvernée. Chez Bomzai, on appelle ça : « mettre de l'ordre ».
Architecture d'un Semantic Layer moderne
Trois composants intégrés.
Le catalogue de métriques. Chaque KPI est défini avec sa formule exacte, ses dimensions autorisées, ses filtres par défaut, et son propriétaire métier. Pas vague. Exact.
Le moteur de calcul. Un outil comme dbt Semantic Layer, Cube.dev ou AtScale qui exécute les définitions de manière cohérente quel que soit l'outil de consommation. Looker, Tableau, Preset, Hex - peu importe. Le résultat doit être identique.
La couche d'accès. Connecteurs vers vos outils BI, notebooks, interfaces conversationnelles. Le Semantic Layer expose les capacités une fois, et n'importe quel outil les consomme.
L'architecture garantit que le chiffre d'affaires affiché dans Looker est strictement identique à celui calculé dans Hex ou retourné par le text-to-insight. Point.
Pourquoi documenter coûte moins que pas documenter
Documenter ses données ? Souvent perçu comme une corvée qui ralentit.
C'est l'inverse. Une documentation de qualité - descriptions de tables, définitions de colonnes, exemples de valeurs, règles de calcul, data lineage - réduit de 70% le temps d'onboarding des nouveaux analystes. C'est aussi le prérequis absolu du text-to-insight. Sans descriptions claires, le LLM ne peut pas interpréter correctement.
dbt facilite ça en intégrant la documentation directement dans le code des transformations. Tests automatisés de cohérence inclus. C'est opérationnel.
Implémentation : quatre phases, six mois
Phase 1 (mois 1-2). Audit des métriques existantes. Vous collectez toutes les définitions utilisées par chaque département. Vous cartographiez les incohérences. Ça fait mal à voir.
Phase 2 (mois 2-4). Alignement avec les propriétaires métier. Finance. Marketing. Ops. RH. Vous tranchez les ambiguïtés. Vous documentez les règles de calcul.
Phase 3 (mois 4-6). Implémentation dans un Semantic Layer (dbt Semantic Layer, Cube.dev). Connexion aux outils de consommation. Gouvernance vivante.
Phase 4 (continu). Processus de création et modification de métriques. Review board trimestriel. Monitoring de l'usage.
Le chantier prend typiquement 3 à 6 mois pour les 50 métriques les plus critiques. C'est pas sexy. C'est fondamental.
dbt : pourquoi c'est le standard
dbt Labs a lancé le Semantic Layer comme extension native de dbt, et c'est devenu le standard de transformation des données. L'avantage : les définitions vivent dans le même repo que les transformations SQL. Versionnées dans Git. Testées automatiquement. Déployées via CI/CD.
C'est production-ready dès le jour 1.
Cube.dev offre une alternative open source avec un moteur de pré-agrégation puissant pour les requêtes haute performance. AtScale cible les environnements enterprise avec compatibilité BI étendue.
Mais le choix naturel pour 90% des équipes ? dbt Semantic Layer.
GenAI + Semantic Layer = ça devient magique
Le Semantic Layer c'est la clé de voûte de la GenAI analytics.
Quand un LLM reçoit une question métier, il a besoin de comprendre le vocabulaire de l'entreprise. Qu'est-ce que la « marge nette » ? Comment se calcule le « taux de churn » ? Quel est le périmètre du « CA consolidé » ? Le Semantic Layer fournit ces définitions au LLM. Une question vague devient une requête précise et fiable.
Sans ce lien ? Text-to-insight produit des résultats faux mais plausibles. Le pire scénario possible.
L'intégration Semantic Layer + LLM via API ou MCP est l'architecture standard en 2026.
En production. Le Semantic Layer c'est le socle invisible qui rend la data fiable et accessible. C'est le chantier le moins sexy mais le plus impactant de toute la stack. Sans lui, tout le reste repose sur du sable. Les données le montrent.

