Les fondements du machine learning

Connaître les groupes de machine learning

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Découvrez les trois grands groupes de machine learning (supervisé, non supervisé et renforcement) ainsi que quelques classes de méthodes existantes.
07:17

Transcription

Nous allons structurer le concept de machine learning. L'idée est d'aborder ensemble la structure du machine learning et pour ceci, il est fréquent de retrouver le machine learning présenté en fait sous la forme du schéma suivant. On y voit les trois pôles je dis bien majeurs du machine learning avec quelques sous-spécialisations et quelques applications classiques. Donc on y voit par exemple l'apprentissage supervisé, ce qu'on appelle supervised learning en anglais, ou simplement aussi abrégé des fois Spv. L'apprentissage supervisé, pour information, c'est une technique d'apprentissage automatique où l'on cherche à produire automatiquement des règles à partir d'une base de données d'apprentissage contenant des exemples d'objectifs labélisés, c'est-à-dire possédant des attributs dans le sens du terme tel qu'utilisé dans le monde des bases de données informatiques. Si on fait un exemple avec l'humain, par exemple l'humain fait de même. S'il voit une action mauvaise à la télévision ou dans la rue à l'extérieur et on lui dit ceci est égal à un meurtre, c'est un événement qui a été labélisé, donc il va apprendre à partir de labels. Ensuite, on a l'apprentissage non supervisé, ce qu'on appelle unsupervised learning en anglais, abrégé aussi Uspv. C'est une technique d'apprentissage automatique où l'on cherche à produire automatiquement des règles à partir d'une base de données d'apprentissage où on n'utilise pas comme objectif des labels d'objectif labélisés explicites. Par exemple, si on est dans un pays où il y a un ensemble de lois et de règles et qu'on observe quelque chose qui rentre dans aucun des canevas des règles définies par la loi, eh bien à ce moment-là on pourrait dire que l'événement qu'on a observé est non labélisé et ce que l'on est en train d'apprendre de cet événement est donc un apprentissage non supervisé. Pour information, la différence entre supervisé et non supervisé peut être illustrée par la figure suivante. Dans la figure suivante, qu'est-ce qu'on peut y voir en haut à gauche ? Eh bien on a d'abord deux types de groupes d'éléments : des étoiles et des cercles. Donc on peut imaginer qu'en vertical, c'est la dette, et qu'à l'horizontal par exemple, c'est le salaire. Alors si on fait un apprentissage supervisé, le but par exemple serait de classer ces groupes de points de façon par exemple bon créditeur/mauvais créditeur en deux groupes distincts, en utilisant le fait que justement on cherche à classer par rapport à une étiquette que l'on connaît déjà, c'est-à-dire on sait que ce sont des bons payeurs ou des mauvais payeurs. Maintenant, il y a le cas de droite où là par contre, on a bien évidemment encore une fois le concept de salaire et de dette, mais on n'a pas du tout le concept à l'avance que l'on sait déjà si c'est des bons ou des mauvais payeurs. On veut pouvoir savoir comment on peut les regrouper de façon pertinente en se basant sur des règles mathématiques semi-empiriques. Ceci étant peut-être une figure de style qui vous permet mieux de faire la différence entre supervisé et non supervisé, revenons maintenant à notre schéma précédent. On a donc également ce qu'on appelle l'apprentissage par renforcement, mais attention, c'est pas les trois seuls entre supervisé, non supervisé et le renforcement, c'est juste la base. Et l'apprentissage par renforcement, qu'on appelle le reinforcement learning, eh bien ça fait référence à une classe de problèmes d'apprentissage automatique dont le but est d'apprendre à partir d'expériences ce qu'il convient de faire en différentes situations de façon à optimiser une récompense quantitative au cours du temps. En d'autres termes, on prend plusieurs cas d'expériences sur des critères qui ont été à la base différents et on essaye d'apprendre à partir de ces expériences multiples. Par exemple, imaginez un continent avec plusieurs pays. Tous les gens dans les pays ayant des éducations et des systèmes culturels différents, on fait des expériences politiques ou religieuses différentes, mais finalement l'ensemble du continent a appris des leçons de ces différents choix et ont convergé ou peut-être divergé par un apprentissage par renforcement à partir de ces sous-apprentissages. Lorsqu'il s'agit enfin d'entrer un peu plus dans les détails, on peut vous montrer le schéma suivant qui est une hiérarchie d'algorithmes et de méthodes très courantes. Par exemple, si on veut voir dans un rapide coup d’œil ce diagramme, on voit que tout en haut, on a en premier le machine learning et ensuite on a un ensemble de familles de techniques de machine learning, comme par exemple la création de groupes d'entités d’événements ou également de ventes. Ensuite, également la réduction de taille de base de données, ce qu'on appelle la réduction dimensionnelle, ou dimensionality reduction, les techniques de régression, ensuite les techniques de lissage de régression, les techniques de réseaux de neurones, donc les neural networks. Ensuite, également le deep learning, donc l'apprentissage profond. Ensuite, l'apprentissage par ensemble qu'on appelle l'ensemble learning, on va comparer sur une même règle d'apprentissage plusieurs apprentissages qui se sont basés sur des événements on va dire similaires, mais échantillonnés aléatoirement. On a le texte, la vidéo et l'image learning où le but, c'est qu'on a des algorithmes qui apprennent à partir de textes, vidéos et d'images. On a ensuite l'apprentissage par règles, où par exemple on va dire à un enfant si tu as cela, alors tu fais ceci, si le feu est vert et qu'il y a pas de voiture, alors tu traverses, c'est ce qu'on appelle les rule system, l'apprentissage bayésien, qui est en fait l'apprentissage basé sur des règles a priori ou a posteriori. On a les arbres de décision dont le but est de faire des classifications par règles structurées en arbres, souvent binaires. Par exemple, si les salaires sont supérieurs à tant, alors on met les gens dans telle catégorie, s'ils sont inférieurs à tant, on les met dans telle catégorie, mais s'ils sont inférieurs à tel salaire et que ce sont des femmes, eh bien on recrée une nouvelle catégorie, et si c'est des hommes, on recrée une nouvelle catégorie et ainsi de suite. Ça ressemble au rule system, simplement que c'est des structures d'arbres. On a également le système de clustering dont le but est de créer des groupes sans se baser sur des labels, souvent. Voilà en gros une hiérarchie classique. Ce qu'il faut savoir, c'est que, à ma connaissance, il y a un petit peu plus de 250 méthodes et algorithmes de machine learning existant à ce jour, et je compte pas évidemment les techniques statistiques de data mining, on se concentre sur le machine learning uniquement.

Les fondements du machine learning

Acquérez les bases du vocabulaire lié au machine learning. Découvrez les outils fondamentaux avec les idées, applications et concepts mathématiques sous-jacents à chacun.

3h04 (33 vidéos)
Aucun commentaire n´est disponible actuellement
Spécial abonnés
Date de parution :21 déc. 2017

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !