Le 14 septembre 2017, nous avons publié une version actualisée de notre Politique de confidentialité. En utilisant video2brain.com vous vous engagez à respecter ces documents mis à jour. Veuillez donc prendre quelques minutes pour les consulter.

Les fondements de l'informatique décisionnelle

Prendre en compte l'historique

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Découvrez comment prendre en compte l'historique dans votre schéma en étoile. Vous allez notamment utiliser la technique de la dimension à évolution lente.
05:05

Transcription

Une différence fondamentale entre un système opérationnel et un système décisionnel est la gestion de l'historique. Très souvent, le système opérationnel montre une vision actuelle des données. Les utilisateurs du système opérationnel ne sont pas intéressés par les anciens prix des produits ou le chiffre d'affaire des années précédentes par exemple. Par contre, le but d'un système décisionnel est de montrer ces données à travers le temps et de conserver un historique des chiffres et de l'évolution des dimensions lorsque cela a du sens pour l'analyse et la décision. Il est rare d'avoir un système décisionnel sans une dimension de temps. Lorsque les utilisateurs interrogent les données d'un cube, ils posent presque toujours l'axe du temps sur une dimension. Vous devez donc également réfléchir à toutes les données que vous voulez conserver à travers le temps, dans vos mesures mais aussi dans vos dimensions. Par exemple, voulez-vous analyser les résultats de vos vendeurs en rapport avec les magasins dans lesquels ils ont travaillé, si, au cours de leur carrière, ils se sont déplacés d'un magasin à l'autre ? Voulez-vous savoir qu'il y a deux ans, ce produit était dans une catégorie différente et pouvoir analyser les ventes lorsque ce produit a changé de catégorie ? Si la réponse est oui, vous devez modéliser vos dimensions en tenant compte de ces contraintes. Pour une dimension donnée, vous pouvez ne pas être intéressé par l'évolution historique des membres. Dans ce cas, la modélisation est simple. Par contre, si vous voulez conserver un historique des changements de valeur de certains attributs de votre dimension, vous devez modéliser cette dimension avec des dates de validité exactement comme on le fait dans un modèle relationnel traditionnel. La technique mise au point par Ralph Kimball et son équipe s'appelle en anglais une slowly changing dimension, ou dimension à évolution lente. Elle est nommée ainsi parce que vous pouvez aussi penser à des dimensions à évolution rapide. Mais c'est un cas plus rare et je ne vais pas en parler dans cette formation. Plus souvent, vous êtes confronté à des données de référence qui peuvent être modifiées de temps en temps sans que ce soient des changements en permanence. Il est donc raisonnable de les gérer avec des dates de validité. La dimension à évolution lente est une technique très souvent utilisée et bien connue en informatique décisionnelle. Les ETL, comme SQL server integration services, inclut des transformations qui simplifient la génération de dimension à évolution lente. Si l'on ne veut pas écraser l'ancienne valeur, on ajoute dans la table de dimension des dates de validité, donc date de début, date de fin, et lorsqu'un changement se produit, on créé une nouvelle ligne pour le même membre de la dimension, avec les nouvelles valeurs des attributs qui ont changé. On conserve donc tout l'historique des changements souhaités. Je vous le disais auparavant : on a pris soin dans notre modèle en étoile ou en flocon d'ajouter nos propres clés, des clés artificielles ou surrogate keys afin de ne pas utiliser comme identifiant unique les clés des bases de données opérationnelles sources. Et cela va justement nous permettre de gérer nos dimensions à évolution lente. Par exemple, un produit, disons une plaque de chocolat aux noisettes, change de nom. Elle s'appelait avant ''petite gourmandise aux noisettes'' et on a décidé de la nommer maintenant ''grande tentation aux noisettes''. Dans la dimension des produits, nous allons conserver la ligne pour le produit avec l'ancien nom et simplement la mettre à jour pour indiquer une date de fin de validité dans la colonne date de fin. Et nous allons ensuite créer une nouvelle ligne qui copie toutes les informations du produit qui n'ont pas changé et évidemment avec le nouveau nom. Dans cette nouvelle ligne, nous allons bien sûr créer une nouvelle clé artificielle unique pour lier la dimension à toutes les lignes de faits qui vont suivre. Mais nous allons indiquer la même clé source que dans la ligne précédente. Nous aurons donc deux clés artificielles uniques, et la même clé source dans les deux lignes. Dans la deuxième ligne, nous indiquerons une date de début qui correspond au jour du changement de nom, et toutes les importations des nouvelles ventes dans la table de faits se fera en indiquant la clé primaire de cette nouvelle ligne. Cette astuce est élégante parce que nous pouvons interroger le cube d'une façon très souple. Si nous voulons extraire toutes les données de vente de ce produit, quel que soit son nom, nous pouvons regrouper les ventes par la clé source de la base opérationnelle et calculer un agrégat. Si par contre, nous voulons analyser les ventes par nom de produit, c'est ce que nous utiliserons dans notre dimension et nous aurons donc deux montants séparés, puisque nous avons deux noms. Nous pouvons donc considérer dans notre analyse une interrogation historique ou ne tenant pas compte de l'historique. C'est parfait.

Les fondements de l'informatique décisionnelle

Abordez les principes fondamentaux de l’informatique décisionnelle. Explorez la gestion des données et leur traitement, les méthodologies et les technologies utilisées, etc.

1h05 (16 vidéos)
Aucun commentaire n´est disponible actuellement
 
Spécial abonnés
Date de parution :29 sept. 2016

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !