Les fondements du machine learning

Analyser avec le text mining et le text learning

TESTEZ LINKEDIN LEARNING GRATUITEMENT ET SANS ENGAGEMENT

Tester maintenant Afficher tous les abonnements
Partez à la découverte du text mining (fouille de textes) et du texte learning (apprentissage de textes), tous deux employés pour l'analyse de textes et de documents.
03:18

Transcription

Toujours dans le domaine des autres classes d'algorithmes, parlons un petit peu du text mining et du text learning. Le text mining, c'est une variante et une branche du data mining, qui s'intéresse spécialement au traitement de corpus de textes, pour en extraire des connaissances ou informations pertinentes, voire même à en générer. Bien qu'il y ait d'autres variantes de mining ou learning, notamment le vidéo mining, le vidéo learning, ou le sound mining, ou le sound learning, c'est à dire pour la vidéo et le son, on va, dans cette session, uniquement se concentrer sur le text learning. Donc pour ce faire, le text mining, l'idée c'est que il procède à l'identification et à l'étiquetage de termes et mots-clés, puis à l'usage de techniques habituelles en machine learning, pour découvrir l'information présente dans les documents qu'il doit analyser, et qui sont structurées, ou non. Donc, les étapes du text mining sont typiquement les suivantes : c'est-à-dire que, d'abord, on collecte du texte brut ou mis en forme, ça peut être des fichiers PDF, des pages web, ou des commentaires sur Instagram, Facebook. Ensuite, on parce le texte, c'est à dire on le décompose, ou également, on reconnaît des morceaux syntaxiques, et autres. Et ensuite, on le filtre, pour enlever tout ce qui ne nous intéresse pas, et faire en fait de la réduction, peut être dimensionnelle. Ensuite, on fait des transformations, c'est-à-dire, on va par exemple mettre tout en minuscules, ou on va tout mettre dans une matrice carrée, qui va permettre d'associer des termes avec d'autres, ou également, on va tout mettre dans une seule langue, et ainsi de suite, ou des choses beaucoup plus mathématiques. Et ensuite, on a la partie text mining, où le but est d'extraire qui nous intéresse, c'est-à-dire par exemple, savoir combien de fois un mot est compté, combien de fois deux mots sont liés, est-ce que un mot est proche d'un autre mot, ou également de faire de l'association roll, pour dire que si quelqu'un a utilisé un mot, souvent, il utilisera tel autre mot. Donc ça, c'est le text mining. Maintenant, il y a le text learning. Alors, le plus souvent, les données textuelles ne sont pas structurées, donc elles ne sont pas labellisées, et c'est le principal défi du text mining, et donc de sa branche, qu'est le text learning. Mais une fois cette étape passée, l'on obtient des données qui sont utilisables pour l'extraction de connaissances ou d'informations, grâce aux techniques de catégorisation, de clustering et de génération, qui sont trois techniques de texte learning. Donc la catégorisation, le clusterring, on sait déjà ce que c'est, on en a déjà parlé. La génération, par contre, c'est quelque chose qui est nouveau dans cette formation, puisqu'il s'agit que les algorithmes apprennent, pour générer automatiquement des articles, ou également des reportages. Il faut savoir que, dans certains pays, la génération de textes, et même de vidéos, par des algorithmes, est déjà chose courante et acceptée, puisque les gens, en fait, regardent un télé-journal qui a été créé totalement par ordinateur, et également d'ailleurs, même en Europe, pour certaines nouvelles que l'on peut lire dans certains journaux et sur certains sites internet.

Les fondements du machine learning

Acquérez les bases du vocabulaire lié au machine learning. Découvrez les outils fondamentaux avec les idées, applications et concepts mathématiques sous-jacents à chacun.

3h04 (33 vidéos)
Aucun commentaire n´est disponible actuellement
Spécial abonnés
Date de parution :21 déc. 2017

Votre formation est disponible en ligne avec option de téléchargement. Bonne nouvelle : vous ne devez pas choisir entre les deux. Dès que vous achetez une formation, vous disposez des deux options de consultation !

Le téléchargement vous permet de consulter la formation hors ligne et offre une interface plus conviviale. Si vous travaillez sur différents ordinateurs ou que vous ne voulez pas regarder la formation en une seule fois, connectez-vous sur cette page pour consulter en ligne les vidéos de la formation. Nous vous souhaitons un excellent apprentissage avec cette formation vidéo.

N'hésitez pas à nous contacter si vous avez des questions !