Le 14 septembre 2017, nous avons publié une version actualisée de notre Politique de confidentialité. En utilisant video2brain.com vous vous engagez à respecter ces documents mis à jour. Veuillez donc prendre quelques minutes pour les consulter.

Les fondements du Big Data

Comprendre le volume

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
La définition du Big Data repose sur les trois V : volume, vélocité et variété. Étudiez cette définition, et plus particulièrement la notion de volume.
04:05

Transcription

Donc, si on sait un peu mieux ce que n'est pas le Big Data, qu'est-ce que le Big Data réellement ? Vaste question, évidemment. Mais on peut préciser les choses. D'abord, malheureusement, le terme Big Data est un terme imparfait, parce qu'il contient le mot « big » qui nous fait penser immédiatement à un volume, mais ce n'est pas que du volume. On peut penser Big Data sans penser de larges volumes, parce qu'on a d'autres contraintes. Et on pourrait faire une première définition globale, rapide du terme Big Data en disant ; ce sont des données qui dépassent les capacités traditionnelles, et pas seulement en volume. Ça peut dépasser des capacités traditionnelles, bien sûr, en volume, mais également en structure de données. Les conteneures traditionnels ont l'habitude de travailler avec des données très structurées, bien structurées. Lorsque des données non structurées, par exemple, des journaux d'activité, ce qu'on appelle des « logs », des journaux d'activité d'utilisateur sur des sites web ou des appareils mobiles sont stockés, ils sont stockés dans un format peu structuré. Et il est, donc, difficile de les analyser avec les outils traditionnels qui sont faits et optimisés pour travailler avec des données bien structurées, par exemple sous forme de table avec des lignes et des colonnes. Autre exemple : On peut avoir des données qui arrivent en flux, en continu, sous forme d'information qui se produisent les unes après les autres, qui arrivent dans notre système, comment est-ce qu'on analyse ça avec des outils traditionnels ? Comment est-ce qu'on stocke ça avec des programmes classiques ? Comment est-ce qu'on stocke ça dans des conteneurs traditionnels ? C'est aussi une problématique qui entre dans le domaine du Big Data, parce qu'on a des difficultés à les traiter avec des outils classiques. Et en fait, il y a une classification ou une explication assez classique du Big Data sous la forme de ce qu'on appelle des trois V. Alors, selon l'inventivité de la personne qui va vous en parler, ce sera trois V, parfois quatre V, parfois cinq V, donc, on va brièvement illustrer ces éléments. Pourquoi des V ? Parce qu'il s'agit de mots qui commencent tous par V. Les trois V principaux dont on parle sont le Volume, la Vélocité et la Variété. On ajoute parfois la Véracité et la Visibilité jusqu'au jour où on aura trouvé un sixième mot en V à ajouter à ces définitions. Revenons sur les différents éléments : Le Volume, ça paraît assez évident. Une étude qui s'appelle Digital Universe Study, de l'IDC a prévu q'en 2020 le volume total des données serait de 35 zettaoctets, alors qu'on analyse à peu près qu'en 2011, ce volume était de 1,8 zettaoctets. Alors, vous allez me dire c'est quoi un zettaoctet ? C'est 1000 petaoctets, c'est, donc, un trillion de gigaoctets, dix puissance 21 octets, ça fait beaucoup, et donc, ça nous fait 35 trillion de gigaoctets. Bon, on a tous vu des chiffres comme ça. Cette étude dit en 2020 on aura 50 fois plus d'informations que maintenant. On aura 75 fois plus de types de conteneurs différents, on aura dix fois plus de types de serveurs et 50% de personnel IT en plus devra gérer ces données volumineuses. Donc, effectivement, ça donne le tournis, en plus, cette étude ne fait que des prédictions un peu vagues, ça peut être plus, ça peut être moins également. Mais la vraie question, c'est OK, on a tous déjà vu ce type de chiffres, ça ne suffit pas à définir le Big Data, mais c'est évidemment une des composantes. On va avoir de plus en plus de données, on en a déjà beaucoup, et déjà aujourd'hui on ne sait pas comment les traiter. On n'en traite qu'une partie infime. Ça fait partie des défis importants du Big Data.

Les fondements du Big Data

Découvrez les enjeux, les outils et les possibilités du Big Data. Familiarisez-vous avec les concepts du Big Data et soyez en mesure de gérer d’importants volumes de données.

1h47 (26 vidéos)
Aucun commentaire n´est disponible actuellement
 
Spécial abonnés
Date de parution :13 juin 2017

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !