Les fondements du machine learning

Découvrir le support vector machine

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Votre formateur vous donne quelques explications sommaires sur le support vector machine, qui est aussi un classifieur supervisé multiclasse.
04:07

Transcription

Nous restons toujours donc avec les classifieurs supervisés pour passer maintenant au support vector machine. Le support vector machine est un algorithme d'apprentissage supervisé qui peut être utilisé à la fois pour la classification et la régression, un peu comme les K-NN mais il est beaucoup plus mathématique. Le SVM est plus couramment utilisé dans le cas de classification et c'est en tant que tel qu'il est aussi parmi les top 10 des algorithmes de l'IEEE. La spécificité du support vector machine est qu'il est capable de trouver des patterns, des motifs fortement non-linéaires grâce à un hyperplan ou une hypersurface qui maximise la marge entre classes comme je vais vous le montrer maintenant. Comme vous pouvez le voir dans cette figure qui est la situation où on imagine qu'on a des groupes de points donc déjà labellisés, donc les rouges et les verts, et puis que on a le but d'un apprentissage avec deux variables donc de type endogène, deux variables qui vont servir à expliquer les labels, c'est pour ça qu'on a pu le représenter sur un plan. Par rapport à ceci les supports vector machine le terme vector vient du fait que ce sont les individus ou les objets représentés ou conceptualisés dans l'algorithme puisqu'ils sont représentés évidemment potentiellement par des vecteurs, c'est ces vecteurs qui permettent de définir l'hyperplan qui va permettre la séparation. C'est l'hyperplan qui permet de définir la séparation à un vecteur qui lui est normal, donc ça veut dire perpendiculaire, et on l'appelle le support vector, d'où le nom support vector machine. La méthode de cet algorithme c'est simplement relatif au calcul vectoriel et de la géométrie analytique. C'est pas trop compliqué tant qu'on fait ça avec des plans ou des hyperplans mais après lorsqu'on commence à faire des cas quadratiques, ça devient un petit peu plus compliqué. Maintenant, au niveau des applications : les applications sont les mêmes que précédemment, donc celles que j'ai déjà citées simplement quand même c'est assez régulièrement utilisé pour des régressions, d'où le fait que j'ai ajouté la régression mais souvenez-vous que cette liste est non exhaustive. Maintenant les mathématiques qui fondent ce classifieur sont complexes, je l'ai déjà mentionné. Par exemple juste pour vous faire une idée du concept, c'est quoi ? C'est que on cherche, et vous le savez déjà, à séparer les individus en plusieurs classes et le support vector machine il cherche le séparateur, donc le plan ou l'hyperplan ou la droite, ça dépend combien de dimensions on travaille, qui premièrement maximisent la distance entre les points ou observations de chacune des deux classes les plus proches du séparateur hyperplan et le séparateur hyperplan et qui minimisent le risque de mauvaise classification aussi bien dans l'échantillon d'entraînement que dans l'échantillon-test. Comme l'illustre la figure que je vais vous montrer maintenant, on voit bien la différence entre par exemple un classifieur à gauche qui est fait avec la régression logistique et un classifieur à droite qui est fait avec le support vector machine. La différence majeure, c'est dû à la marge ou la distance qu'il existe entre les points ou observations et le séparateur. Comme vous pouvez le voir avec la régression logistique le séparateur est très proche de la catégorie de points blancs alors que avec le support vector machine il doit être le plus loin possible de chacun des deux groupes de points puisqu'ils sont labellisés, je vous rappelle qu'on fait du supervisé. À ce niveau là, c'est le séparateur optimal que recherche le SVM, le support vector machine et qui laisse donc le maximum de marge par rapport aux points ou observations les plus proches. Ce sont ces points ou si vous préférez ces observations proches qui définissent les limites de la marge maximale qu'on appelle aussi vector support. Ce sera tout concernant le SVM.

Les fondements du machine learning

Acquérez les bases du vocabulaire lié au machine learning. Découvrez les outils fondamentaux avec les idées, applications et concepts mathématiques sous-jacents à chacun.

3h04 (33 vidéos)
Aucun commentaire n´est disponible actuellement
Spécial abonnés
Date de parution :21 déc. 2017

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !