Le 14 septembre 2017, nous avons publié une version actualisée de notre Politique de confidentialité. En utilisant video2brain.com vous vous engagez à respecter ces documents mis à jour. Veuillez donc prendre quelques minutes pour les consulter.

Les fondements du Big Data

Héberger son Big Data dans le cloud

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Découvrez en quoi un cloud public, comme Amazon Web Services ou Microsoft Azure, constitue un environnement idéal pour le déploiement de solutions Big Data.
03:21

Transcription

Pour déployer votre solution Big Data, vous pouvez, soit le faire « On Premise », comme on dit, c'est-à-dire dans vos propres locaux dans votre propre Data Center avec vos propres machines, ou bien, et c'est une solution de plus en plus populaire, le faire sur un cloud public . Éventuellement, un cloud privé, fournit par un hébergeur mais souvent sur un cloud public. Les deux clouds publics, évidemment, les plus populaires sont AWS, pour « Amazon Web Services » et « Microsoft Azure ». De plus, vous pouvez utilisez des machines virtuelles dans Amazon ou ces deux ou dans Azure pour déployer vos propres machines virtuelles ou bien des containers de type Docker, par exemple, sur un cloud public. Mais vous avez déjà des solutions prédéfinies sous formes d'Applications en tant que services dans les clouds publics. Par exemple, Amazon EMR pour « Elastic MapReduce » vous offre déjà des Packages d'Hadoop, de Spark, de HBase, de Hive, pour monter vos infrastructures Big Data directement dans AWS. Vous avez également « Amazon Machine Learning » qui est un service qui contient déjà des systèmes d’analyse avec des algorithmes de Machine Learning. Vous avez « Amazon Athena » qui est un système de requête SQL interactif que vous pouvez lancer sur des sources de données qui sont dans EC2. Par exemple, des fichiers Parquets ou des fichiers Avro. Vous n'avez pas pour l'instant d'offres packagées, directement de Data Lake dans Amazon, mais vous pouvez créer votre propre Data Lake avec les fonctionnalités déjà évoquées d'Amazon avec EMR, avec le Machine Learning, etc. Si vous voulez utiliser plus spécifiquement Spark, vous pouvez aussi utiliser Databricks et un compte Databricks. Databricks est une société qui s'est créée autour d'Apache Spark et qui a une activité de développement de Spark qui est très intense. Datbricks vous propose également des clusters hébergés dans AWS de Spark et vous avez même une édition communautaire, si vous l'utilisez pour du développement, elle est gratuite. Autrement, vous pouvez mettre en place votre système Spark d’analyse de façon tout à fait managée par Databricks, en utilisant des éditions Starter professionnel, etc. Du côté d'Azure de Microsoft, la distribution d'Hadoop dans Azure s'appelle « HDInsight », HD pour Hadoop, bien sûr. C'est un service Hadoop et Spark dans le Cloud de Microsoft. Vous avez aussi une offre, dite « Data Lake Analytics », donc, un service de travail d'analyse à la demande, avec une interrogation possible en SQL, en R, en Python. Et vous avez aussi une offre de Machine Learning avec les algorithmes intégrées en tant que Platforme, en tant qu'Application, en tant que Service dans Azure. Avec tout cela vous pouvez développer votre système de Big Data à l'aide d'un cloud public, vous pouvez le tester et vous pouvez le mener en production dans un cloud public également. Comme je vous le disais, c'est une solution qui est très souvent choisie de nos jours.

Les fondements du Big Data

Découvrez les enjeux, les outils et les possibilités du Big Data. Familiarisez-vous avec les concepts du Big Data et soyez en mesure de gérer d’importants volumes de données.

1h47 (26 vidéos)
Aucun commentaire n´est disponible actuellement
 
Spécial abonnés
Date de parution :13 juin 2017

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !