Découvrir la data science avec Python

Manipuler le dataframe

Testez gratuitement nos 1300 formations

pendant 10 jours !

Tester maintenant Afficher tous les abonnements
Réalisez quelques manipulations avancées du dataframe, notamment en utilisant la fonction map avec une expression lambda.
06:09

Transcription

Sur votre dataframe vous avez à peu près la même fonctionnalité que nous avons vu dans Numpai sur le ndarray. Par exemple vous pouvez modifier et travailler sur tout un dataframe sous forme de calculs globaux ou on pourrait dire vectorisés. Mais vous avez un dataframe donc c'est encore plus puissant. Donc par exemple, il y a des fonctionnalités très intéressantes du dataframe vous avez un certain nombre de propriétés ou de méthodes donc avoir directement les colonnes, comme ceci, qui sont mentionnées comme propriétés du dataframe, là ça me retourne, finalement, une série. Vous avez des méthodes comme T, par exemple, pour Transposer, regardez comme c'est magique. Je vous remontre mon dataframe. J'ai donc ici des index sur les départements et mes colonnes sont les hectolitres et le total. Je transpose, donc en fait je pivote. Et ça me donne mes départements en colonnes, et puis en ligne, ben j'ai transposé blanc, rosés, rouges et mes totaux. Donc voilà qui est très pratique également. Vous pouvez transposer moins. Vous vous souvenez, on a par exemple la fonction head où je prends les 10 premiers, et je transpose. Voilà. Vous avez compris, c'est quand même très très souple. Je mets ça en commentaire. Je reviens sur le travail avec une colonne, par exemple. Eh bien, cette colonne a elle, également, un certain nombre de propriétés, de méthodes, comme le Transpose également, comme des méthodes qui vont vous permettre de récupérer tout, certains, de faire des append, etc. Et puis vous pouvez bien sûr modifier tout le contenu de la colonne en travaillant sur une série qui finalement est la série des valeurs de la colonne. Vous pouvez avec un describe obtenir des informations plus précises sur la colonne, c'est-à-dire les différentes valeurs, et puis le type sous-jacent. Là on se retrouve vraiment avec un travail plutôt sur des ndarrays. Vous pouvez bien sûr modifier les valeurs, on l'avait vu quand on travaillait avec Numpai, ceci aussi, hein, fonctionne. Et là je suis en train de modifier la valeur de blancs. Je peux également utiliser une fonction qui est très pratique, qui est la fonction map, et qui, un peu à l'image de Python, qui est sous-jacent, va permettre de faire une modification alors prenons notre blanc, ici. Et puis on va faire un "+1", par exemple. Alors évidemment je peux faire ça, hein, mais on va le regarder avec la fonction map. Donc ma fonction map, prend une expression lambda, donc, en Python, le lambda s'exprime comme ça, et comme ceci, avec le paramètre, et puis je vais faire un travail dessus. Donc je vais avoir toute la puissance de Python pour travailler avec cette colonne. Par exemple, je pourrais séparer des valeurs s'il se trouve que le séparateur des décimales était une virgule ou que quelque chose n'a pas été compris ou si c'est du texte, je peux faire des split. Ou je peux faire différents types de travail arithmétique sur cette valeur de colonne si c'est du float ou de l'entier. Bref, vous avez compris, en fait on a toute la puissance de Python à disposition. Et là je vais simplement faire un "x + 1", et donc, bien entendu cette fonction map eh bien va appliquer cette fonction anonyme, finalement, ce lambda, à tous les éléments de la colonne, ou de la série si vous préférez. Donc si je fais ça, j'ai 10748, ici. Alors que, vous vous souvenez que, on est à 10747, donc ça marche quand même. Il se trouve que la fonction map retourne le résultat comme vous pouvez le voir, hein, finalement, ici, je n'affiche rien donc j'ai un retour du résultat. Il faudrait que je l'attribue comme ceci, à la colonne elle-même pour que ça soit physiquement stocké dans le dataframe. Et pous aller un peu plus loin, donc, on commente ça, ça nous intéresse pas beaucoup… Pour aller un peu plus loin, on pourrait aussi utiliser la fonction apply qui va permettre, comme son nom l'indique, d'appliquer même à toute une série de valeurs dans le dataframe, on n'est pas seulement limités à une colonne. Si je reprends ici différentes colonnes qui sont mon choix de colonnes sur les trois couleurs de vin, blanc, rosé et rouge, eh bien j'ai maintenant un dataframe. Sur tout ce dataframe, je vais demander un apply, et je vais passer une lambda. Bon on va faire ça, hein… On va additionner. C'est pas terrible terrible, et donc, maintenant on va appliquer à toutes les valeurs de cellules. Voyez 48, 29, alors si je reviens sur la valeur précédente, je commente, donc ici on a 29, on a 65 et… 64 et 28. Donc, je peux grâce à la fonction apply faire des choses magnifiques également dans mon dataframe. Voilà. Il s'agit donc de quelques démonstrations, les possibilités sont vraiment énormes dans Pandas. Pour qu'on soit bien d'accord, parce que c'est vrai que je suis passé peut-être un peu vite là-dessus… Au niveau du lambda, c'est quelque chose qu'on a déjà abordé dans le catalogue, sur les formations Python. Mais une fonction « lambda », c'est une fonction qui est exprimée ici en ligne. Finalement, au lieu de définir une fonction quelque part, par exemple je pourrais faire un def un peu plus haut, faire une fonction et puis appeler ici la fonction qui serait nommée, eh bien au lieu de faire ça je fais ce qu'on appelle une fonction anonyme. J'exprime avec une expression lambda, c'est-à-dire une expression formelle de ce type, je passe un ou plusieurs paramètres, je mets un deux-points et puis je travaille avec mes paramètres, eh bien j'exprime une fonction assez simple, que je peux directement disposer à l'endroit où j'aurais pu l'appeler. C'est une forme de fonction anonyme exprimée avec une expression lambda. Donc voilà pour la précision.

Découvrir la data science avec Python

Prenez en main les outils utilisés pour la data science avec Python, d'un point de vue technique. Pour cela, explorez les deux bibliothèques importantes, NumPy et Pandas.

2h16 (25 vidéos)
Aucun commentaire n´est disponible actuellement
 
Logiciel :
Spécial abonnés
Date de parution :25 août 2016

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !