Traitement des données textuelles avec l’apprentissage automatique

Intelligence artificielle Science des données Sciences du langage

Durée

20 heures

Formule d'enseignement

En ligne

Formation publique

Clientèle cible

S’adresse aux professionnels de l’industrie œuvrant dans des postes liés à la programmation ou à l’exploitation de données, principalement des développeurs amenés à développer des outils de traitement automatique du langage.

Préalables

Formation Notions de base de l’apprentissage automatique, formation Notions de base de l’apprentissage profond et des réseaux de neurones, formation Préparation, nettoyage et visualisation des données textuelles ou connaissances équivalentes :

Connaissance de base en programmation (langage Python suggéré)
Connaître les notions de base de l'algèbre linéaire et du calcul différentiel

Description

Vous ne savez pas par quelle autoformation commencer? Consultez le cheminement proposé afin de maximiser le développement de vos connaissances.

Cette formation vise à permettre au professionnel de l’industrie d’être en mesure utiliser des techniques statistiques du traitement automatique de la langue naturelle (TALN). Elle se veut axée sur la pratique, afin d’outiller le professionnel et le rendre opérationnel rapidement.

Le traitement automatique de la langue naturelle (TALN), un sous-domaine de l'intelligence artificielle, est de plus en plus utilisé dans l’industrie, pour analyser des documents, extraire de l’information dans des textes ou créer des assistants virtuels (chatbots) par exemple.

Pour modéliser adéquatement un problème d’affaire pouvant être réglé à partir du TALN, après avoir préparé ses données, il faut en assurer la classification avant de pouvoir résoudre un problème d’affaire.

Objectifs

Départager des problèmes de classification de texte des problèmes de classification de séquence et de modélisation de langue
Utiliser différents algorithmes de représentation de textes pour faire de la classification de textes
Expliquer un problème un problème de classification de séquence à l’aide de l’algorithme HMM
Utiliser une librairie utilisant l’apprentissage profond pour résoudre un problème de classification de séquence
Appliquer une technique statistique pour entraîner un modèle de langue

Contenu

Partie 0 : Introduction au traitement des données textuelles avec l'apprentissage automatique

Partie 1 : Classification de texte avec encodage simple

Module 1.1 : Classification avec modèle naïf bayesien
Module 1.2 : Classification par régression logistique
Module 1.3 : Sélection d’attributs dans la représentation de textes
Module 1.4 : TF-IDF
Module 1.5 : Représentation par n-grammes
Module 1.6 : Création d’attributs de représentation

Partie 2 : Modèle de langue

Module 2.1 : Modèle de langues statistique
Module 2.2 : Exemple - Modèles de langue et dictées trouées avec mots précédents comme contexte
Module 2.3 : Exemple - Modèles de langue et dictées trouées avec mots précédents et suivants comme contexte

Partie 3 : Classification de séquences

Module 3.1 : Classification de séquences statistique
Module 3.2 : Exemple - Entraînement de reconnaisseur d'entités nommées
Module 3.3 : Exemple - Classification de textes filtrés par classe grammaticale

Précisions sur la formation

Cette formation est une autoformation. Vous pouvez débuter votre apprentissage au moment où vous le souhaitez. La plateforme de la formation vous sera accessible pour une durée de 365 jours suivant votre première connexion à PAX.

PAX Expérience

PAX est une plateforme unique d’apprentissage novatrice, dite intelligente, qui regroupe des outils d’apprentissage adaptatifs et interactifs. Elle agit véritablement comme un tuteur intelligent permettant à l’apprenant d’apprendre par déduction en connaissant la nature et la source de ses erreurs.

Avantages distinctifs de PAX :

La théorie est exposée sous forme de modules multimédias interactifs
Des exercices interactifs permettent l'approfondissement des notions théoriques enseignées. Ceux-ci sont analysé par PAX, qui offre une rétroaction immédiate et individuelle afin d'aider le participant à corriger ses erreurs par déduction
Des quiz chronométrés permettent au participant de tester ses acquis autant de fois qu’il le désire
Un forum contextuel où les fils de discussions sont liés aux contenus (modules-exercices et quiz)
Un forum animé par des experts en Python

Découvrez tous les avantages de PAX Expérience : https://www.fsg.ulaval.ca/etudes/formation-continue/pax-experien

Reconnaissance

Une attestation de participation reconnaissant les 20 heures de formation continue est décernée, après la formation, à chacun des participants qui respectent les conditions d'attestation.

Admissible au règlement de la formation continue de l’Ordre des ingénieurs du Québec (OIQ).

Qui va m'accompagner ?

David Beauchemin

Candidat au doctorat en informatique, Université Laval

Camille Besse

Scientifique de données, Institut Intelligence de données

Luc Lamontagne

Professeur agrégé, Faculté des sciences et de génie, Université Laval

Frédérik Paradis

Expert en IA, Baseline

Charles-Antoine Parent

Scientifique de données, baccalauréat en actuariat et maîtrise en IA

Marc Parizeau

Professeur titulaire

Dominique Pothier

Responsable aux Opérations, Expert en IA, Baseline

Antoine Prieur

Développeur IA

Pierre Snell

Scientifique de données

Inscription individuelle

Offerte en tout temps

En ligne

Prix régulier

300,00 $

S'inscrire

Prix étudiant

100,00 $

S'inscrire