Découvrir la data science avec Python

Manipuler le tableau structuré

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Découvrez la méthode pour accéder aux éléments de votre tableau par leur index ou en utilisant les rangées de Python.
07:27

Transcription

Donc, comme vous le voyez, on a généré un tableau structuré à l'aide de notre fichier en entrée. Vous voyez également les types de données ici sont exprimés dans une notation qui est une notation en chaîne de caractères. Si vous vous référez à la documentation de Numpai, vous pouvez aller sur les objets et les types de données et puis avoir plus d'informations sur la notation et les types de données disponibles, bien entendu. Avant de travailler avec ce tableau structuré, qui est très pratique, on va le voir, je vais vous montrer juste une autre notation je peux reprendre comme ça mon lot de texte et puis je peux faire un unpack. Alors je vais aller à la fin. Je vais ajouter un paramètre ici, qui est donc unpack à TRUE. La valeur par défaut bien entendu est FALSE. Et si je fais un unpack, eh bien je vais générer générer pour chaque colonne des tableaux différents. Donc je peux, si j'en ai besoin, le stocker dans des arrays différents et utiliser l'unpacking de Python pour faire ceci, ce qui fait que dans a, j'aurai mes int8 qui sont des départements. Et puis dans b, j'aurai tous les déclarants. Bon c'est pas la peine de faire ça, je vais travailler avec mon tableau structuré mais c'était pour vous montrer. Donc je reviens sur mon lot de texte, qui me génère mon tableau structuré, et je vais regarder un peu à l'intérieur. Donc, comment obtenir le premier élément, évidemment, c'est très simple. Comment voir, c'est shape, 75, j'ai soixante-quinze valeurs. La dimension, on la connaît, la size, on la connaît, comment obtenir dans mon tableau structuré par exemple cette valeur ? Eh bien très simplement en faisant référence à l'intérieur de mon tableau à la valeur 0 dans l'élément zéro. Et donc, je peux faire référence à ceci, et à ceci, pour avoir le département et puis le nombre de déclarants. Je peux utiliser des index nommés puisque mon type de tableau structuré est "département" avec un int8, "declar" avec un int32, donc je peux faire tout à fait ceci. Ou ceci, bien sûr. Je peux également le récupérer dans l'autre sens. Comme j'ai un tableau structuré je peux récupérer un tableau qui comporte seulement la première valeur, c'est-à-dire les départements. En faisant ceci, très simplement, j'peux même revenir en arrière, enlever ça, et voici le tableau de mes départements et bien entendu le tableau de mes déclarants donc vous voyez que c'est très très souple d'utilisation. et qu'on va pouvoir manipuler ces données surtout grâce à Numpai qui va nous permettre de faire des opérations de listes. Bien entendu maintenant je peux faire ça plus un, si j'en ai besoin, et on a compris qu'on peut utiliser nos opérateurs et nos fonctions universelles sur le tableau tout entier ou sur un des éléments de notre tableau structuré. Et bien entendu, si je peux faire ceci, je peux faire ceci. Obtenir le premier élément "déclarants", donc 468, qui correspond, à notre premier, ici, élément du tableau. Et donc vous avez bien compris on peut le faire dans un sens comme dans l'autre. Je peux faire ceci, ou bien on l'a déjà fait d'ailleurs, ceci. Donc on est très très souple sur l'utilisation. On peut bien entendu, puisqu'on est sur un tableau et qu'on est dans Python, utiliser des opérateurs de slicing de Python, c'est-à-dire Je voudrais avoir les déclarants à partir de zéro jusqu'à dix, et voilà notre array qui vient en retour. Vous connaissez, juste pour vous rafraîchir la mémoire, l'opérateur de slicing qui est le deux-points. Je peux dire "début" "fin", et puis je peux ajouter aussi un nombre d'éléments à prendre par exemple, deux. Et 468, on saute celui-ci, 153 qui est là, on saute 12, on prend 12, on saute 17, on prend 301, etc. Ce qui serait d'ailleurs très pratique si je voulais avoir tous les nombres impairs, je fais comme ça. Alors, évidemment l'opérateur de slicing, juste un autre rappel, je peux ne rien mettre à gauche et à droite, et donc, si je ne mets rien à gauche, c'est depuis le début, si je ne mets rien à droite, c'est jusqu'à la fin. Ceci voudrait dire « à partir du dixième jusqu'à la fin. » Donc là je prends tout, manifestement. Si je fais ceci, je prends du début jusqu'à la fin, mais j'en prends un sur deux. Et donc, j'ai mes valeurs qui sont les valeurs impaires et je pourrais commencer à un pour avoir des valeurs paires. Valeurs paires s'entend, dans l'index, bien entendu, de mon tableau puisqu'ici ces valeurs ne correspondent pas à des numéros qui sont incrémentaux, bien sûr. Ça se verrait plus si je le fais on peut le faire comme ceci, sur… le département. Une dernière chose à dire sur les capacités de l'array dans Numpai. Si je fais quelque chose comme ceci. Par exemple je vais prendre mes départements. Et je vais dire "plus grand que" 15. "Départements" plus grands que 15. Si on réfléchit un petit peu, on dit les opérateurs travaillent donc sur chaque élément de la liste, donc on pourrait s'attendre à ce que, cet opérateur, qui est un opérateur de comparaison, me retourne, ben quoi, en fait ? Ça doit retourner un booléen. Pour chaque valeur de la liste, l'opération de comparaison devrait retourner vrai ou faux. Par exemple, "département" 1, ben ce serait faux. Et "département" 19, ce serait Vrai. Alors qu'est-ce qui va être retourné ? Vous avez presque deviné ! Un tableau de booléens qui correspondent à chaque position. Ce tableau de booléens, en retour, va pouvoir être utilisé pour filtrer la liste. Ou va pouvoir être utilisé, plutôt, pour représenter un index des éléments de la liste à prendre. C'est-à-dire, je peux très bien faire ça. Dire maintenant, je veux a et à l'intérieur, je vais tester et je vais prendre, comme vous le voyez, ben chaque élément qui correspond à un index TRUE. Donc, 0, 1, 2, 3, 4, là je parle en index, purement, ne vont pas être pris. Mais à partir de ceux-ci, eh bien, chaque élément qui correspond à cette position dans l'index va être pris. C'est assez intéressant et c'est très pratique. Vous pouvez bien entendu stocker ce tableau dans une variable, hein, je l'ai fait comme ça, directement en ligne, mais je pourrais très bien stocker ça dans je pourrais dire i pour "index", bon c'est pas terrible, hop, et ensuite je fais un a de i "a[i]" pour récupérer seulement les éléments qui m'intéressent. Et également, vous pouvez faire une négation, c'est-à-dire en utilisant le tilde, tous les éléments qui ne correspondent pas donc on renverse le test booléen, et j'ai de 1 à 15.

Découvrir la data science avec Python

Prenez en main les outils utilisés pour la data science avec Python, d'un point de vue technique. Pour cela, explorez les deux bibliothèques importantes, NumPy et Pandas.

2h16 (25 vidéos)
Aucun commentaire n´est disponible actuellement
Logiciel :
Spécial abonnés
Date de parution :25 août 2016

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !