Le 14 septembre 2017, nous avons publié une version actualisée de notre Politique de confidentialité. En utilisant video2brain.com vous vous engagez à respecter ces documents mis à jour. Veuillez donc prendre quelques minutes pour les consulter.

Excel 2013 : Analyse de données avec Power Query

S'initier à la notion d'ETL

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Dans cette séquence, vous aborderez la notion d'ETL (Extract Transform Load, extracto-chargeur). Vous découvrirez également si Power Query est vraiment un ETL.
06:23

Transcription

Alors maintenant je souhaiterais vous parler d'un acronyme qui est important lorsqu'on travaille pour Power Query car on entend souvent dans les entreprises et administrations les informaticiens et les analystes business en faire usage et il s'agit de l'acronyme anglophone ETL. Alors, de quoi s'agit il ? Alors pour ceci sachez que j'aime bien utiliser la définition de Wikipédia France. Alors selon Wikipédia France actuellement, le premier paragraphe c'est que un ETL c'est un Extract-Transform-Load donc connu sous l'acronyme ETL comme vous pouvez le lire ou en français extracto-chargeur ou parfois, mais c'est très rare, de datapumping donc on pompe des données. Un ETL est donc une technologie informatique intergicielle, c'est-à-dire c'est un outil qui sert d'intermédiaire entre deux technologies permettant d'effectuer des synchronisations massives d'information d'une source de données vers une autre. Donc actuellement on voit que Power Query rentre dans cette définition. Ensuite, selon le contexte, on est amené à exploiter différentes fonctions d'un ETL souvent combinées entre elles : c'est-à-dire on extrait, on transforme et on constitue. Donc ici c'est l'équivalent donc de l'acronyme anglais, ces trois termes que je viens de signaler maintenant de Extract Transform et Load. Donc par constituer c'est-à-dire on restitue le résultat des transformations dans un logiciel final qui est souvent le logiciel qui va servir pour faire les rapports. Mais on peut également parler de conversion ou d'alimentation. Donc encore une fois on voit que pour l'instant Power Query rentre dans la définition d'un ETL. Deuxième paragraphe de la définition de Wikipédia, c'est que cette technologie repose sur des connecteurs servant à exporter ou importer les données dans les applications des transformateurs qui manipulent les données, c'est-à-dire les agrèges, les filtres ou les conversions et des mises en correspondance c'est-à-dire des mappages avec des liaisons comme le ferait RechercheV. L'objectif donc de l'ETL est d'intégrer ou ré-exploiter les données d'un réservoir source vers un réservoir cible. Et encore une fois donc, Power Query et bien rentre parfaitement dans cette définition, d'où le fait que les informaticiens, les analystes business et donc maintenant de plus en plus d'employés de toute la chaîne d'une organisation parlent d'ETL lorsqu'ils utilisent Power Query. Maintenant j'ai remarqué dans les formations que je donne qu'il était utile d'introduire certains concepts par rapport au fonctionnement d'un ETL. La première étape on peut dire du pipe-line de Power Query ou d'un ETL, c'est-à-dire la procédure de fonctionnement c'est qu'on a des sources de données multiples, vraiment dans de nombreux différents formats, beaucoup plus que ce que propose Excel par défaut sans Power Query et on veut extraire des données de toutes ces différentes sources hétérogènes dans le but donc de les transformer, de les nettoyer, de les lier pour ensuite les reconstituer proprement dans un réservoir cible qui sera dans le cas qui nous intéresse Excel lui-même afin d'en générer des rapports, c'est-à-dire de faire de la BI, la Business Intelligence ou si vous préférez en français de l'intelligence économique. Maintenant j'ai aussi remarqué dans les formations qu'il était quand même utile de définir l'étape extraction de ETL. Alors dans l'étape extraction de ETL, il y a évidemment les choix ou le choix de la source donc ça peut être des fichiers Excel, txt, json, xml qui de toutes façons sont des fichiers textes, ou MySQL, Oracle, SAP ou AS/400. Ensuite on applique des filtres au moment où on se connecte à la source, donc ça veut dire avant d'avoir importé les données afin de ne pas trop charger l'ETL inutilement en données. On peut également appliquer des choix de colonnes avant même d'importer, toujours dans le but de pas trop charger l' ETL en termes de mémoire. Enfin, il y a l'étape transformation où là aussi j'ai remarqué que c'était utile de donner des définitions avant d'entrer dans le vif du sujet. Donc dans transformation, on entend les nettoyages comme nettoyer les doublons dans certaines situations, les caractères mal saisis, les erreurs de calcul faits par les employés, etc, c'est-à-dire tout ce que l'humain peut faire comme erreurs de saisie. Ensuite il y a les remplacements. Qu'est-ce qu'on entend par remplacement ? Et bien à nouveau par exemple c'est l'usage de certains accents pas compatibles avec notre système informatique. Ça peut être également le fait qu'on est dans une multinationale et que malheureusement les filiales ont saisi dans une autre langue que l'anglais. À ce moment-là, on va devoir remplacer toute la terminologie francophone, par exemple le nom des pays qui ont été saisis en français dans leur équivalent anglais. Un autre exemple, ce sont les dates. Beaucoup de filiales ne respectent pas les normes internationales de dates qui normalement dans tous les pays du monde doivent être année-mois-jour donc il va y avoir un gros travail de remplacement à effectuer. On a également un autre cas fréquent qui sont les codes pays où certains employés utilisent les codes des normes ISO sur deux lettres, certains sur trois lettres donc il va s'agir d'homogénéiser tout ça. Ensuite on a tout ce qui est jointure, c'est-à-dire les liaisons entre des tables. Par exemple, on peut avoir une table des ventes dans lesquels les clients qui ont fait donc un achat ont été codés via leur numéro de client. Par contre, dans une autre table, vous avez le nom de ces clients avec aussi leur code client et vous souhaitez donc avoir comme résultat final une table des ventes où il y a le nom des clients. Et bien en faisant une liaison entre les deux tables, c'est-à-dire celle des ventes où il y a que le code client et la table où vous avez les noms des clients avec leur code, et bien en faisant une liaison comme on le fait avec RechercheV, vous allez pouvoir avoir une seule table résultante avec les ventes et le nom du client. Simplement Power Query va beaucoup plus loin que ce que permet de le faire RechercheV. Enfin on peut faire des synthèses de données donc des agrégats dans Power Query même s'il faut l'avouer c'est plutôt rare parce que les gens sont beaucoup plus à l'aise avec les tableaux croisés dynamiques et les Power Pivot pour faire ce genre de manipulation. Et enfin, à chacune des étapes de nettoyage de remplacement de jointures et de synthèses, on peut aussi appliquer des filtres et des tris. Donc on n'est pas obligé de faire ça qu'au tout début, on peut le faire à n'importe quel moment de ou des transformations. Donc voilà pour cette petite introduction concernant le concept d'ETL et comme vous avez pu le voir je souhaitais juste revenir sur le concept d'extraction et de transformation plus en détails, mais pas sur le chargement, parce que sur le chargement on m'a jamais posé de questions donc il semblerait que ce soit trivial pour beaucoup de gens.

Excel 2013 : Analyse de données avec Power Query

Analysez des données avec Excel 2013 et Power Query. Apprenez à importer, consolider, lier, nettoyer, fusionner ou scinder des données provenant de différentes sources.

2h53 (34 vidéos)
Aucun commentaire n´est disponible actuellement
 
Logiciel :
Spécial abonnés
Date de parution :8 sept. 2017

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !