Les fondements du machine learning

Mener la validation des algorithmes

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Qu'il s'agisse de notre propre existence ou de la pérennité du système économique, la validation des méthodes de machine learning est capitale. Découvrez ici l'une des approches possibles.
04:04

Transcription

Pour clore cette formation, nous allons parler d'un sujet qui tient évidemment à coeur aux statisticiens et aux informaticiens, et aux gestionnaires, il s'agit de la validation et des tests de ces algorithmes, de ces outils qui apprennent tout seuls. Il faut considérer que, dans certains pays, des intelligences artificielles ont déjà remplacé en partie les médecins généralistes, ou également les actions intergouvernementales dans des situations de crise. Quelle est l'idée de la validation et des tests de ces algorithmes ? Sans entrer dans les détails, l'idée est la suivante : tout, ainsi que l'humain, s'entraîne à partir de données, qu'elles soient visuelles, numériques, électriques, etc. elles forment un bloc. L'idée la plus élémentaire, à laquelle la plupart des gens vont penser pour, on va dire enseigner à un enfant, ou à une machine, c'est de couper le bloc d'expérience d'origine en deux sous-blocs, c'est à dire le jeu d'entraînement, ou d'apprentissage, et le jeu de test. Et qu'est-ce qu'on va faire ? C'est comme dans des formations, avec le jeu d'apprentissage, on va faire apprendre l'algorithme ou l'humain, et ensuite, pour voir, comme ça se passe d'ailleurs dans les formations avec les humains, quand les ressources humaines veulent faire passer un test à leurs employés, on garde une partie en réserve du savoir, pour ensuite le mettre dans un examen, et voir si l'apprentissage a réussi. Donc, c'est assez proche de l'être humain, c'est assez naturel. Ҫa, c'est la première étape, c'est celle, à nouveau, qui est la plus intuitive, puisque, si vous allez dans une entreprise et qu'on vous demande de passer des tests après des formations, vous verrez que vous aurez implicitement passé par l'étape entrainement, et par l'étape test. Mais il y a une étape supérieure, c'est de couper le jeu d'entraînement en deux sous-ensembles. On a notre jeu d'entraînement, qui est réduit encore lui-même en un sous-jeu d'entraînement, mais également en un sous-jeu de validation. Et certaines entreprises et centres de formation, mais ils sont en minorité, font ça avec les humains qui suivent les formations présentielles. Quelle est l'idée ? C'est qu'à nouveau, on va utiliser les données d'entraînement, pour entraîner l'humain ou l'algorithme, c'est à dire qu'on va partager, transférer un savoir, on va entraîner le cerveau. Ensuite, on va faire des micro-validations, l'idée étant, par exemple via un jeu de questions-réponses simples entre l'humain, c'est à dire le professeur, et ses étudiants, de valider rapidement si les élèves ont compris. Ce n'est pas dans l'idée de corriger la méthode d'enseignement du professeur, mais c'est dans l'idée d'identifier des éléments qui ont coincé les élèves. C'est ce qu'on appelle des hyper-para mètres, en machine learning. C'est donc à cela que sert le paramètre de validation, et lorsqu'on a validé ces hyper-paramètres, avec les données de test, parce qu'on a toujours gardé les données de tests d'origine, eh bien on vérifie si on a un résultat qui est globalement meilleur. On peut passer aussi via toutes les étapes, ce qui est encore mieux, c'est à dire qu'on peut garder la première étape, avec le jeu de données d'entraînement et le jeu de -données-test seulement, sur un groupe d'individus, et avec un autre groupe indépendant d'individus, on fait avec les trois blocs, c'est à dire le jeu d'entraînement, le jeu de validation et le jeu de test. Et on peut comparer les deux, voir lesquels réussissent le mieux. Donc voilà une idée de test de validation d'algorithmes de machine learning. Évidemment, dans le testing data, ce qu'il faut savoir, c'est que, dans de nombreux domaines de l'industrie, il y a des valeurs standardisées et normalisées pour contrôler les sorties des outils de machine learning, et on appelle ça d'ailleurs des données-étalons. Cette démarche que nous venons de voir, de séparation des données, peut s'appliquer à presque toutes les méthodes que nous avons présentées antérieurement. C'est ce qu'on appelle les données d'origine,

Les fondements du machine learning

Acquérez les bases du vocabulaire lié au machine learning. Découvrez les outils fondamentaux avec les idées, applications et concepts mathématiques sous-jacents à chacun.

3h04 (33 vidéos)
Aucun commentaire n´est disponible actuellement
Spécial abonnés
Date de parution :21 déc. 2017

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !