Bomzai › Insights › Cas clients
Feature Store ML industrialisé
Contexte
Banque retail avec 20+ modèles ML en production (scoring crédit, fraude, churn, pricing, AML). Chaque équipe data science calcule ses propres features de manière indépendante, entraînant des duplications et des incohérences. Un même client peut avoir un score de risque différent selon le modèle car les features 'revenu' ou 'ancienneté' sont calculées différemment par chaque équipe.
Problème & Défi
Features recalculées indépendamment par chaque équipe : 60% de duplication d'effort. Incohérences entre modèles : un même client a des scores contradictoires selon les features utilisées. Temps de développement d'un nouveau modèle : 3 mois dont 70% consacré au feature engineering. Aucun versioning des features : impossible de reproduire un modèle à une date donnée. Features temps réel impossibles : chaque modèle recalcule à la volée, impactant les temps de réponse.
Solution & Livrables
Feature Store centralisé avec 500+ features versionnées et documentées. Double serving : batch (pour l'entraînement) et temps réel (pour l'inférence) via la même définition. Catalogue de features avec lineage, statistiques et monitoring de drift. Pipeline de calcul de features industrialisé avec scheduling et monitoring. Réduction du time-to-model de 3 mois à 3 semaines grâce à la réutilisation.