Les fondements de l'informatique décisionnelle

Définir les briques de l'informatique décisionnelle

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Définissez les briques de l'informatique décisionnelle et les outils qui sont utilisés. Il s'agit de travailler pour l'importation des données, pour la création de structures multidimensionnelles et pour la visualisation des résultats.
05:03

Transcription

Le développement d'un système décisionnel implique de poser de bonnes fondations. Bonnes fondations d'un point de vue fonctionnel bien entendu, et nous devrons y revenir, mais bonnes fondations également d'un point de vue d'architecture technique. D'abord les données d'un système décisionnel sont naturellement extraites des données opérationnelles. Les systèmes OLTP sont en général hétérogènes, par exemple les logiciels d'ERP, c'est-à-dire des logiciels de gestion de l'entreprise, des bases de données spécialisées comme les bases comptables, les bases de données de sites web, et des journaux de fréquentation de ces sites web, des imports de fichiers qui viennent de l'intérieur ou de l'extérieur de l'entreprise, et toutes ces sources doivent converger vers un data mart. L'importation de ces données doit bien entendu être automatisée pour être effectuée régulièrement. Cela peut être développé manuellement à l'aide de scripts, mais le plus souvent on utilise un outil dédié qui s'appelle un ETL. ETL, ça signifie Extract, Transform et Load. Et donc c'est un outil graphique qui permet de dessiner des flux d'importation de données qui contiennent les trois opérations indiquées dans le nom de l'outil. Extract donc l'extraction des sources diverses : bases de données, fichiers journaux, etc. Ensuite le -T- pour la transformation de ces données, données brutes qu'on transforme de façon à les enrichir, à ajouter des informations d'audit, à qualifier les informations de référence, à nettoyer éventuellement les données. Bref, toute une suite d'opérations nécessaires à préparer les données au système décisionnel. Et enfin, dernière opération, le chargement, donc Load dans un entrepôt, un data mart ou un data warehouse. Souvent les données sont importées dans un espace intermédiaire qu'on appelle une base de données de staging. L'ETL n'est pas forcément utilisé pour effectuer la préparation complète des données. Il reste souvent souvent du travail de vérification et d'agrégation à faire, et cela peut être fait dans une base de données de staging à l'aide de procédures SQL. Finalement, lorsque les données sont prêtes, on les ajoute de façon incrémentale au data mart. Le data mart est une base de données SQL modélisée d'une façon particulière. Il existe aujourd'hui plusieurs modèles mais les modèles multidimensionnels historiques sont de deux types : schéma en étoile ou schéma en flocon. Je vais revenir plus tard sur cette modélisation des données. Cette intégration étant faite, on doit parfois régénérer le cube lui-même selon le modèle de stockage du cube. Alors, il y a plusieurs modèles traditionnels du stockage et on va les parcourir brièvement. D'abord, le modèle MOLAP avec un -M- ou OLAP multidimensionnel. C'est un modèle qui importe les données du cube dans une structure physique dédiée pour optimiser les performances de l'analyse. Ensuite le modèle ROLAP avec un -R- ou OLAP relationnel, conserve les données analytiques dans une base de données SQL relationnelle qui économise donc un stockage supplémentaire. Mais dans ce cas, les performances peuvent être plus erratiques selon la qualité du moteur relationnel et l'optimisation effectuée. Le modèle HOLAP avec un -H- ou OLAP hybride est un mélange des deux. Le plus souvent, les données historiques sont conservées dans un stockage MOLAP et les données les plus récentes, par exemple celles qui sont intégrées au fil de l'eau dans la journée sont conservées dans la base relationnelle, donc en ROLAP. Ce qui permet d'interroger ensemble les deux sources dans des cubes partitionnés et de profiter de données analytiques historiques et fraîches. Il existe aujourd'hui des modèles en mémoire, aussi, basés sur un stockage en colonnes et compressé des données à analyser et qui tire parti de la quantité plus importante de RAM des machines modernes. Dans l'outil Microsoft SQL Server Analysis Services, il existe depuis 2012 un modèle tabulaire qui se base sur ces technologies. Les données peuvent être à disposition sur un serveur, mais elles peuvent être également déportées sur une machine client pour l'analyse rapide d'un volume peut-être plus modeste de données mais sans que la connexion à un serveur soit nécessaire. Le modèle tabulaire dont je viens de vous parler est une version serveur d'un outil sur Excel nommé PowerPivot qui offre cette fonctionnalité sur la machine cliente. PowerPivot tire aussi bénéfice de l'augmentation de la RAM sur les ordinateurs de bureau ou les portables. On parle parfois de Desktop OLAP dans ce cas. Il me faudra aussi parler d'une utilisation spécifique des données analytiques qu'on appelle de data mining, ou forage des données. Dans ce cas, l'analyse des données n'est pas effectuée par un être humain mais par des algorithmes qui vont chercher à extraire des informations ou des tendances signifiantes des données analytiques pour effectuer par exemple de la classification ou de la prédiction.

Les fondements de l'informatique décisionnelle

Abordez les principes fondamentaux de l’informatique décisionnelle. Explorez la gestion des données et leur traitement, les méthodologies et les technologies utilisées, etc.

1h05 (16 vidéos)
Aucun commentaire n´est disponible actuellement
 
Spécial abonnés
Votre/vos formateur(s) :
Date de parution :29 sept. 2016
Durée :1h05 (16 vidéos)

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !