L'essentiel de Hadoop

Définir le Big Data

Testez gratuitement nos 1255 formations

pendant 10 jours !

Tester maintenant Afficher tous les abonnements
Dans cette vidéo, vous découvrirez les principes du Big Data. Vous comprendrez également l'utilité d'un framework dédié.
03:30

Transcription

Maintenant que nous avons vu ce qu'était le NoSQL, essayons de voir et de définir ensemble ce qu'est le Big Data. Via la définition communément admise, aujourd'hui, on définit le Big Data grâce aux trois V ou aux cinq V. Il s'agit de cinq notions que l'on considère à la base du Big Data. Pour les trois V, il y a la Variété, le Volume et la Vitesse, auxquels peuvent s'ajouter les deux notions de Véracité et de Valeur qui font ainsi les cinq V. Prenons ces notions une par une. Le volume est relativement simple, il vient du terme même Big Data, donc « grosses données » en français. Le volume correspond donc au fait que le nombre de données, la volumétrie des données, est trop importante pour être soit stockée, soit être traitée de manière convenable sur une seule machine. On va donc avoir besoin d'un cluster de machines, et c'est dans ce cadre-là où on peut dire que l'on passe dans le Big Data. La vitesse vient du besoin de traiter rapidement justement ces données. Même si on a un gros volume de données à traiter sur une seule machine, cela peut être faisable si on n'a pas de contraintes de temps à respecter. Cependant, si on veut des résultats en temps réel, proches du temps réel, ou avec des contraintes de vitesse assez importantes, on va avoir besoin d'algorithmes parallélisés sur plusieurs machines pour pouvoir les traiter. La variété vient enfin du fait que les données peuvent venir de sources diverses et variées, hétérogènes, et qui ne vont pas toutes respecter le même format de données. On va donc avoir des données qui sont faiblement structurées, ou peu structurées ou pas du tout structurées, et avoir par exemple des textes bruts, des images, ou peu importe d'ailleurs. Toutes ces données vont être concentrées au sein du même cluster de données, et c'est l'agrégation de toutes ces données qui va pouvoir donner à proprement parler, une valeur à l'ensemble. Le Big Data doit donc être adapté pour pouvoir traiter des données quel que soit leur format et quelle que soit leur origine. A ces trois V qui constituent à proprement parler le cœur du Big Data, on rajoute donc les deux notions de véracité et de valeur. La véracité, c'est le fait de pouvoir évaluer le fait qu'une donnée soit correcte ou non, de pouvoir éliminer, pruner tout simplement, les données qui nous semblent incorrectes ou incohérentes. La valeur, c'est le fait de dégager des nouvelles connaissances, des nouvelles données à partir des données existantes. C'est le fait de pouvoir en déduire de nouvelles, en apprendre de nouvelles, et réellement de pouvoir donner une valeur supplémentaire et de pouvoir déduire des choses nouvelles à partir des données existantes. Le Big Data à proprement parler est définit à partir du moment où on atteint un ou plusieurs de ces critères dans un système, et de ce fait-là, où les solutions traditionnelles, par exemple les SGBDR, donc les systèmes de base de données relationnelle ne peuvent plus stocker ces données de façon correcte et convenable, ou alors, ou à partir du moment où les algorithmes traditionnels ne peuvent plus traiter ces données de façon correcte et convenable, notamment dans les temps impartis.

L'essentiel de Hadoop

Mettez en pratique les concepts spécifiques à Hadoop. Abordez l'HDFS pour le stockage, les MapReduce pour le traitement, ainsi que la base de données NoSQL d​e Hadoop : HBase.

3h43 (42 vidéos)
Aucun commentaire n´est disponible actuellement
 
Logiciel :
HBase HBase 1.2
Spécial abonnés
Date de parution :31 mars 2017

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !