Les fondements du Big Data

Comprendre le machine learning

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Avec l'apprentissage automatique ou machine learning, vous verrez de quelle manière les données sont analysées par les algorithmes d'apprentissage.
04:05

Transcription

Parlons maintenant un peu du « Machine learning » qu'on peut traduire en français par apprentissage automatique ou apprentissage statistique et qui est finalement, une branche de la recherche informatique sur l’intelligence artificielle. En « Big Data », on va simplement utiliser toute une série d'algorithmes qui vont permettre de résoudre des questions ou de chercher dans les données, des choses nouvelles parfois, avec des algorithmes qui sont capables d'évoluer ou d'affiner leur résultat. Les algorithmes de « Machine learning », vont avoir une phase d’apprentissage qui leur permet justement d'affiner les résultats. On peut classifier d'ailleurs, les algorithmes par phase d'apprentissage, il y en a plusieurs, mais les deux plus important sont les apprentissages dits supervisés et les apprentissages non supervisés. L'apprentissage supervisé veut dire qu'on a déjà à la base, un modèle prédéfini de classement, par exemple, un être humain qui a déjà classifié des données et ensuite, l'algorithme va se baser sur cette classification existante, sur ce qu'on appelle des étiquettes pour travailler sur des données nouvelles. On parle d'apprentissage non supervisé comme l'algorithme n'a pas d'étiquette et qu'il n'y a pas, finalement, de données de modèle prédéfini, ce sont des algorithmes, par exemple, qui font du « clustering », de la classification pars qu’à partir des données, elles-mêmes, en récupérant certains éléments de ces données, on peut tester des formes de classification sans avoir déjà une classification préexistante à partir de critères ou d'attributs de ces données. Parmi les algorithmes qui existent, il en a plusieurs, bien sûr, on peut parler d'algorithme qu'on peut regrouper par algorithmes de régression, de régression statistique, de régression linéaire et ce qu'on va faire avec la régression, c'est prendre ce qu'on appelle une variable, en statistique, on a des variables dites variables continues ou variables discrètes, c'est-à-dire des informations des données, si elles sont continues, c'est une suite d'information, si elles sont discrètes, ce sont des informations unitaires, peut-être un groupe d'information. Et la régression va permettre de prendre une variable, par exemple, à régression linéaire, à une variable qu'on dit expliquée et on va cherche à l'aide d'autres variables à expliquer pourquoi cette variable peut changer, par exemple. Donc le modèle de régression, c'est de prendre une forme de données et de l'analyser avec des données qui lui sont liées, avec lesquelles on l'allie pour essayer de trouver du sens aux changements de cette variable. Il existe aussi des algorithmes d'apprentissage de métriques qui permettent de prendre deux variables, deux éléments et de mesurer leur degré de parenté, ce qui peut permettre de faire de la classification, c'est-à-dire de dire, certains éléments sont parents ou ne sont pas parents. Autres types d'algorithmes classiques ; les « arbres de décision », on prend petit à petit, une décision en affinant cette décision à travers un « arbre de choix », les algorithmes dits bayésiens qui viennent du théorème de Bayes qui est un théorème, une théorie des probabilités, c'est simplement le fait de pouvoir déterminer des probabilités à partir d’observation de l'expérience et donc, cela permet avec un certain nombre de critères analysés des données, de déterminer l'estimation d'une probabilité. On connaît les algorithmes bayésiens pour le classement, par exemple, probabilité de spam qu'on reçoit dans notre boîte e mail. Et puis des algorithmes de classification, simples ou on peut dire de « clustering », on classifie nos éléments dans des groupes de façon totalement automatique. Les algorithmes de classification peuvent être non supervisés. Également, on inclue dans les algorithmes de « Machine learning », des algorithmes plus complex, beaucoup plus multiformes, comme les « Réseaux neuronaux » et qu'on appelle maintenant, le « Deep learning », c'est-à-dire l'apprentissage profond qui est un ensemble de méthodes d'apprentissage automatique, beaucoup plus riche et qui offre des perspectives très intéressantes pour le « Machine learning ».

Les fondements du Big Data

Découvrez les enjeux, les outils et les possibilités du Big Data. Familiarisez-vous avec les concepts du Big Data et soyez en mesure de gérer d’importants volumes de données.

1h47 (26 vidéos)
Aucun commentaire n´est disponible actuellement
Spécial abonnés
Date de parution :13 juin 2017

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !