Excel 2013 : Analyse de données avec Power Query

Renommer les colonnes

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Suivez les bonnes pratiques concernant le renommage des colonnes. Ainsi, vous serez en mesure de produire des classeurs aux informations pertinentes.
06:25

Transcription

La prochaine étape triviale, lorsqu'on transforme les données, après avoir changé le typage, c'est souvent de renommer les colonnes des données importées. Suivant le type de procédure qu'on a utilisé pour l'import, le nom des colonnes peut être catastrophique. Donc déjà, je vais vous montrer comment renommer, mais également les bonnes pratiques du renommage. Parce que dans le domaine de l'informatique, qui est quand même un sous-domaine de l'ingénierie, qui lui-même est un sous-domaine des sciences, il y a une manière de renommer qui est robuste et pérenne et assez intelligente. Alors par exemple, ici, cette colonne, qui est normalement le numéro des clients, on voit bien que ce sont des nombres entiers. Donc si on suit la nomenclature de Leszynski-Reddick on la nommera int, pour dire que c'est un entier, avec un _, et ensuite on mettra le nom de la colonne. Bon normalement on a plutôt tendance à mettre ça en onglet dans les multinationales, donc on évite l'usage des accents, et simplement on valide par Entrée. Donc comme vous pouvez le voir, c'est très simple. Alors petite parenthèse : qu'est-ce que c'est la nomenclature de Leszynski-Reddick ? Alors déjà ce sont deux Russes dont les noms de famille sont respectivement Leszynski je ne vais pas vous l'épeler, je vous laisse aller regarder sur Google. Et Reddick, qui est le nom de famille du deuxième. Ces deux Russes ont mis en place dans les années septante une méthode de nommage proposée à l'ensemble de la communauté scientifique et informaticienne mondiale, afin que tout le monde nomme les variables et les objets de la même manière, et faire aussi en sorte que les nommages soient inter-systèmes, c'est-à-dire compatibles sur plusieurs systèmes informatiques différents. Si maintenant je vais sur Secteur d'activité, ce sont des textes, donc dans la nomenclature de Leszynski-Reddick, c'est str, et puis ici c'est Secteur d'activité. Vous pouvez mettre Secteur activité aussi tout court, ça c'est à vous de voir. Ensuite ici, les Numéros de commande, rebelote, double-clic, c'est un nombre entier donc int_NumeroCommande, comme ceci. Ensuite la Date de commande, toujours conformément à Leszynski-Reddick, dat_, et ici donc DateCommande. Ça fait un peu de la redondance avec le dat du début. Alors je vous explique pourquoi cette nomenclature. Déjà, c'est une nomenclature utilisée mondialement par les informaticiens et par les spécialistes en gestion de données. Et également parce que, lorsqu'on fait des formules, on n'est pas embêté par les espaces qui rendent les formules affreuses à lire dans de nombreux systèmes informatiques. Et également on a l'avantage, lorsqu'on relit une formule, de tout de suite savoir à quel type de données on a affaire, sans avoir à devoir aller dans la table pour se dire : "Est-ce que ça c'est bien des dates, c'est bien des nombres entiers ?". On le voit directement via le nom. Donc c'est clair que lorsque l'on voit oui ça c'est Date de paiement lorsque l'on voit, je disais, une colonne dans une formule, et qu'elle s'appelle par exemple str_Article, on sait indirectement que c'est pas le nombre d'articles, mais c'est une chaîne de caractères sur les articles, et donc que c'est probablement le nom des articles. Donc par exemple ici à nouveau int_Quantité etc. Là évidemment, je vais vous faire cadeau du fait de renommer toutes les colonnes de toutes les sources, d'ailleurs ce que je ne ferai pas, mais normalement, il faut le faire. Attention, le renommage des colonnes, si vous le faites plus tard, ça des impacts a considérables, surtout sur vos PowerPivot et sur les formules, car Power Query ne met de loin pas tout à jour. Donc si par exemple et là j'ai des clients qui se sont plantés non seulement ils ne renommaient pas leurs colonnes conformément à Leszynski-Reddick, mais en plus ils avaient plusieurs colonnes qui se nommaient de la même manière dans différentes requêtes. Donc faut bien réfléchir à une stratégie il de nommage. Si par exemple j'ai colonne avec une Nom client, eh bien il y a le nom des clients, par exemple dans la table des ventes, également mais le nom des clients dans la table des abonnés à la newsletter. Donc est-ce qu'il ne faudrait pas mieux nommer une des colonnes str_NomClientVente, et dans l'autre table str_NomClientAbonne. Parce que après, lorsque vous allez faire des fusions et utiliser PowerPivot, on risque de ne plus rien comprendre, ce qui est arrivé à certains de mes clients qui ne comprenaient plus rien de ce qu'ils faisaient. Donc réfléchissez correctement, tranquillement, à une stratégie de nommages. Alignez-vous si possible sur Leszynski-Reddick. Maintenant, dernier point concernant le renommage, vous remarquerez que dans le panneau de droite, donc paramètres de la requête, des ça crée une étape Colonnes renommées. Cette étape-là, si je double-clique dessus, je ne peux pas voir les détails des renommages que j'ai faits. Et vous remarquerez qu'il ne fait qu'une seule étape pour les colonnes renommées. Donc si tout d'un coup je veux revenir sur un des renommages que j'ai faits, ce sera pas en passant par un engrenage qui n'existe pas, puisqu'il n'y en a pas, mais simplement sur une des colonnes, parce que tout Dernière information concernant le renommage, puis après ce sera fini, et je vous promets, concernant ce sujet, c'est que si tout à coup vous venez à changer la source et que le nom d'origine des colonnes n'est plus le même, cette étape de Colonnes renommées ne fonctionnera plus. Parce que au fait, je vais l'expliquer maintenant, ce qu'il faut comprendre de ce que fait PowerQuery, c'est que lorsqu'on double-clique sur une colonne, il regarde le nom de la colonne sur laquelle on double-clique et il la mémorise. Donc là il cherche Data, Prix par pièce, pour, à chaque fois qu'on rafraîchit, renommer cette colonne qui s'appelle Data.Prix par pièce, C'est-à-dire dans le cas présent, c'est un décimale, donc je vais l'appeler sng, parce que c'est comme ça dans Leszynski-Reddick, qui veut dire single. Et là, donc, je vais l'appeler PrixParPiece. Et si un jour je change la source et qu'il n'y a pas le nom qui s'appelait Data.Prix par pièce, je va ne trouve pas la colonne Data.Prix par pièce. Donc vous devrez supprimer cette étape, et vous retaper tous les renommages. Oui, je sais c'est laborieux, mais tant que vous n'avez pas une maîtrise fine du langage M, que l'on découvrira un peu plus tard, il faudra procéder ainsi. comme je vais la renommer maintenant. il va y avoir un message

Excel 2013 : Analyse de données avec Power Query

Analysez des données avec Excel 2013 et Power Query. Apprenez à importer, consolider, lier, nettoyer, fusionner ou scinder des données provenant de différentes sources.

2h53 (34 vidéos)
Aucun commentaire n´est disponible actuellement
 

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !