Le 14 septembre 2017, nous avons publié une version actualisée de notre Politique de confidentialité. En utilisant video2brain.com vous vous engagez à respecter ces documents mis à jour. Veuillez donc prendre quelques minutes pour les consulter.

Excel 2016 : Analyse de données avec Power Query

S'initier à la notion d'ETL

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Dans cette séquence, vous aborderez la notion d'ETL (Extract Transform Load, extracto-chargeur). Vous découvrirez également si Power Query est vraiment un ETL.
06:44

Transcription

Alors maintenant je souhaiterais vous parler d'un acronyme qui est important lorsqu'on travaille Power Query, car on entend souvent dans les entreprises et administrations, les informaticiens et les analystes business en faire usage. Il s'agit de l'acronyme anglophone ETL. Alors de quoi s'agit-il ? Pour ceci, sachez que j'aime bien utiliser la définition de Wikipédia France. Selon Wikipédia France actuellement, le premier paragraphe c'est que un ETL, c'est un extract-transform-load, donc connu sous l'acronyme ETL, comme pouvez le lire, ou en français, donc vous allez comprendre pourquoi on n'utilise pas trop le terme français, extracto-chargeur. Ce terme nous fait penser à un chantier, d'où le fait qu'on ne l'utilise pas, ou parfois, mais c'est très rare, de datapumping, donc on pompe des données. À noter, elle est donc une technologie informatique intergicielle, c'est-à-dire c'est un outil qui sert d'intermédiaire entre 2 technologies, permettant d'effectuer des synchronisations massives d'informations d'une source de données vers une autre. Donc actuellement on voit que Power Query rentre dans cette définition. Ensuite, selon le contexte, on est amené à exploiter différentes fonctions d'un ETL souvent combinées entre elles, c'est-à-dire qu'on extrait, on transforme et on constitue. Donc ici, c'est l'équivalent de l'acronyme anglais, ces 3 termes que je viens de signaler maintenant, de extract, transform et load. Donc par constituer, c'est-à-dire on restitue les résultats des transformations dans un logiciel final qui est souvent le logiciel qui va servir pour faire les rapports. Mais on peut également parler de conversion ou d'alimentation. Donc encore une fois, on voit que pour l'instant Power Query rentre dans la définition d'un ETL. Deuxième paragraphe de la définition de Wikipédia, c'est que cette technologie repose sur des connecteurs servant à exporter ou à importer les données dans les applications, des transformateurs qui manipulent les données, c'est-à-dire les agrégations, les filtres ou les conversions, et des mises en correspondance, c'est-à-dire des mappages avec des liaisons comme le ferait RechercheV. L'objectif donc de l'ETL est d'intégrer ou réexploiter les données d'un réservoir source vers un réservoir cible. Et encore une fois, donc Power Query eh bien rentre parfaitement dans cette définition. D'où le fait que les informaticiens, les analystes business et donc maintenant de plus en plus d'employés de toute la chaîne d'une organisation, parlent d'ETL lorsqu'ils utilisent Power Query. Maintenant j'ai remarqué dans les formations que je donne qu'il était utile d'introduire certains concepts, par rapport au fonctionnement d'un ETL. La première étape, on peut dire du pipeline de Power Query ou d'un ETL, c'est-à-dire la procédure de fonctionnement, c'est qu'on a des sources de données multiples, vraiment dans de nombreux différents formats, beaucoup plus que ce que propose Excel par défaut sans Power Query. Et on veut extraire des données de toutes ces différentes sources hétérogènes, dans le but donc de les transformer, de les nettoyer, de les lier, pour ensuite les reconstituer proprement dans un réservoir cible, donc qui sera dans le cas qui nous intéresse Excel lui-même, afin d'en générer des rapports, c'est-à-dire de faire de la BI, de la Business Intelligence, ou si vous préférez en français, de l'intelligence économique. Maintenant j'ai aussi remarqué dans les formations qu'il était quand même utile de définir l'étape Extractions de ETL. Alors dans l'étape Extractions de ETL, il y a évidemment les choix ou le choix de la source. Donc ça peut être des fichiers Excel, TXT, JSON, XML, qui de toute façon sont des fichiers texte, ou MySQL, Oracle, SAP ou ice 400. Ensuite on applique des filtres au moment où on se connecte à la source, donc ça veut dire avant d'avoir importé les données, afin de ne pas trop charger l'ETL inutilement en données. On peut également appliquer des choix de colonne avant même d'importer, toujours dans le but de pas trop charger l'ETL en termes de mémoire. Enfin, il y a l'étape Transformations, où là aussi j'ai remarqué que c'était utile de donner des définitions avant d'entrer dans le vif du sujet. Donc dans Transformations, on entend les nettoyages, comme nettoyer les doublons dans certaines situations, les caractères mal saisis, les erreurs de calcul faits par les employés, etc, c'est-à-dire tout ce que l'humain peut faire comme erreur de saisie. Ensuite il y a les remplacements. Alors qu'est-ce qu'on entend par remplacements ? Eh bien à nouveau par exemple c'est l'usage de certains accents pas compatibles avec notre système informatique, ça peut être également le fait qu'on est dans une multinationale et que malheureusement les filiales ont saisi dans une autre langue que l'anglais. À ce moment-là, on va devoir remplacer toute la terminologie francophone, le nom des pays qui ont été saisis en français dans leur équivalent anglais. Un autre exemple, ce sont les dates : beaucoup de filiales ne respectent pas les normes internationales de date qui normalement dans tous les pays du monde doivent être année-mois-jour. Donc il va y avoir un gros travail de remplacement à effectuer. On a également un autre cas fréquent qui sont les codes pays, où certains employés utilisent les codes des normes ISO sur 2 lettres, certains sur 3 lettres. Donc il va s'agir d'homogénéiser tout ça. Ensuite on a tout ce qui est jointure, c'est-à-dire les liaisons entre des tables. Par exemple, on peut avoir une table des ventes dans laquelle ont été codées via leur numéro de client, par contre dans une autre table, vous avez le nom de ces clients avec aussi leur code client. Et vous souhaitez donc avoir comme résultat final une table des ventes où il y a le nom des clients. Eh bien en faisant une liaison entre les 2 tables, c'est-à-dire celle des ventes où il n'y a que le code client, et la table où vous avez les noms des clients avec leurs codes, eh bien en faisant une liaison comme on le fait avec RechercheV, vous allez pouvoir avoir une seule table résultante avec les ventes et le nom du client. Simplement, Power Query va beaucoup plus loin que ce que permet de faire RechercheV. Enfin on peut faire des synthèses de données, donc des agrégats dans Power Query, même s'il faut l'avouer, c'est plutôt rare, parce que les gens sont beaucoup plus à l'aise avec les tableaux croisés dynamiques et les Power Pivot pour faire ce genre de manipulation. Et enfin, à chacune des étapes de nettoyages, de remplacements, de jointures et de synthèses, on peut aussi appliquer des filtres et des tris. On n'est pas obligés de faire ça qu'au tout début. On peut le faire à n'importe quel moment de ou des transformations. Donc voilà pour cette petite introduction concernant le concept d'ETL, et comme vous avez pu le voir, je souhaitais juste revenir sur le concept d'extraction et de transformation plus en détails, mais pas sur le chargement parce que sur le changement on ne m'a jamais posé de questions, donc il semblerait que ce soit trivial pour beaucoup de gens.

Excel 2016 : Analyse de données avec Power Query

Analysez des données avec Excel 2016 et Power Query. Apprenez à importer, consolider, lier, nettoyer, fusionner ou scinder des données provenant de différentes sources.

3h00 (34 vidéos)
Aucun commentaire n´est disponible actuellement
 
Logiciel :
Spécial abonnés
Date de parution :8 sept. 2017

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !