Machine Learning avancée

Objectifs

Comprendre la nature des problèmes traités par les techniques d’apprentissage automatique utilisées dans le Big Data

Pre-requis

Des connaissances solides en statistiques et en algorithmes sont exigées.

Public visé

Ingénieurs et techniciens, Chefs de projet et toute personne ayant déjà été sensibilisée par la machine learning.

Programme
Module 1 : INTRODUCTION ET HISTORIQUE

Processus complet d’élaboration d’un modèle prédictif

Module 2 : ARBRES DE DÉCISION

L’apprentissage par partitionnement
Construction d’un arbre de décision sur un jeu de données synthétique
Principaux points à considérer lors de l’induction d’un arbre de décision à partir de données
CHAID, C4.5 et CART : Les trois principales méthodes d’induction d’arbres proposés dans les logiciels
Les différences et les points communs

Module 3 : ARBRES DE RÉGRESSION

La régression par arbres
Une méthode non-linéaire de régression
Rapprochement avec les arbres de décision

Module 4 : ANALYSE DISCRIMINANTE PRÉDICTIVE

Un modèle paramétrique de discrimination
Analyse discriminante de Fisher
Évaluation globale du modèle
Évaluation individuelle des variables

Module 5 : RÉGRESSION LOGISTIQUE

Le modèle LOGIT
Estimation, évaluation globale et évaluation individuelle des variables
Régression logistique polytomique
Régression logistique lorsque la variable dépendante Y prend plus de 2 valeurs
Régression logistique multinomiale lorsque Y est nominale
Régression logistique polytomique ordinale lorsque Y est ordinale (odds adjacents, odds cumulatifs proportionnels)

Module 6 : CLASSIFIEUR BAYESIEN NAÏF (MODÈLE D’INDÉPENDANCE CONDITIONNELLE)

Principe de l’indépendance conditionnelle
Cas des prédicteurs continus
Cas des prédicteurs discrets
Construction d’un modèle explicite linéaire
Sélection de variables

Module 7 : BAGGING, RANDOM FOREST, BOOSTING

Méthodes ensemblistes basées sur des apprentissages répétés
Boosting : principe et variantes
Principe du Bagging
Random Forst : principe et variantes
Mesures d’importance des variables – Impact sur le biais et la variance des classifieurs

Module 8 : GRADIENT BOOSTING

Généralisation du boosting avec l’introduction explicite de fonctions de coûts
Importance du paramétrage

Module 9 : SUPPORT VECTOR MACHINE (SVM)

Principe de Machines à vecteurs de support ou Séparateur à Vaste Marge
Principe de la maximisation de la marge
Marge souple (soft margin)
Classifieurs linéaires et classifieurs non-linéaires avec l’astuce du noyau (kernel trick)
Fonction Noyau

Module 10 : RÉSEAUX DE NEURONES – PERCEPTRON SIMPLE ET MULTI-COUCHES

Introduction aux réseaux de neurones artificiels pour l’apprentissage supervisé
La Perceptron
Passage du modèle linéaire au modèle non-linéaire : le perceptron multicouche

Module 11 : APPRENTISSAGE NON SUPERVISÉ

Principe du clustering (K moyennes ou k means)
Principe de la Classification Ascendante Hiérarchique (CAH)
Règles d’association

Module 12 : DISCRÉTISATION DES VARIABLES QUANTITATIVES

Découpage en classe d’une variable quantitative
Méthodes non-supervisées et supervisées (chi-merge, mdlpc)

Module 13 : FILTRAGE DES VARIABLES

Approche FILTRE préalable à l’apprentissage supervisé
Techniques de classement (ranking)
Techniques de sélection basées sur la corrélation
Information mutuelle, entropie de Shannon, rapport de corrélation, lambda de Wilks

Module 14 : INDUCTION DE RÈGLES PRÉDICTIVES

Construction de bases de règles en analyse prédictive
Conversion des arbres en règles et algorithmes génétiques pour l’induction de règles

Module 15 : SCORING – LE CIBLAGE MARKETING

Le ciblage clientèle
Construction et lecture de la courbe LIFT (GAIN CHART)

Module 16 : ANALYSE RFM (RÉCENCE – FRÉQUENCE – MONTANT)

Segmentation RFM (récence-fréquence-montant)
Finalité, démarche, usage, variantes, limites

Module 17 : GRILLE DE SCORE

Élaboration de la grille de score à partir des résultats de la régression logistique
Méthode Disqual et scoring

Module 18 : INTÉGRATION DES COÛTS DE MAUVAIS CLASSEMENT EN APPRENTISSAGE SUPERVISÉ

Prise en compte des coûts pour l’évaluation et la construction des modèles prédictifs
Correction des règles d’affectation, techniques intégrées, bagging, la méthode MetaCost
Courbe ROC
Évaluation d’un classifieur à l’aide de la courbe ROC
Le critère AUC

Module 19 : QUELQUES MÉTHODES NON-PARAMÉTRIQUES DE DISCRIMINATION

Deux méthodes non-paramétriques de classement dérivés du schéma Bayesien la méthode des K-plus proches voisins et le modèle d’indépendance conditionnelle
Modalités de déroulement
Formation présentielle ou distancielle dispensée par un formateur expérimenté. La formation alterne des exposés théoriques, des démonstrations et la mise en pratique au travers d'exercices et de cas concrets.
Méthode et moyens mobilisés
Evaluation des acquis tout au long de la formation à travers des Tps, des Quizz ;
Evaluation de satisfaction de fin de formation ;
Attestation de fin de formation précisant les modules acquis et en cours d’acquisition ;
Support de cours remis en fin de session.
Modalités d'accès
Vous pouvez vous inscrire pour suivre une de nos formations jusqu'à la veille de la date de démarrage si la formation est financée directement par votre entreprise ET si le nombre maximum de participants n'est pas atteint. Si la formation est financée via un OPCO, vous devez au préalable avoir obtenu un accord de ce dernier.
Accessibilité aux personnes en situation de handicap
Nos locaux sont accessibles aux Personnes à Mobilité Réduite PMR. De plus, nos conseillers sont disponibles pour vous accompagner dans vos démarches à travers nos partenaires. Nous sommes en mesure de mobiliser les expertises, les outils nécessaires pour vous accueillir, vous accompagner et vous former.

Télécharger la fiche PDF

4,5/5

Satisfaction stagiaire

Univlearn obtient la note de 4,5 sur 5 pour les sessions de formation dispensées en 2023 et 2024.

6909

Stagiaires en 2023

Univlearn a formé un total de 6909 stagiaires au cours de l'année 2023,

8190

Heures de formation

Univlearn a assuré un total de 8190 heures de formation en inter et intra.

Témoignages clients

Très bon formateur qui connaît bien son sujet !

Management de Projet - Serge G.

Très bien, le contenu de la formation était bien adapté au passage de la certification PSM I et correspondait à mes attentes.

PSM - Eric D.

Très bon formateur. Formation enrichissante.

PSK - Clarisse D.

Formateur de qualité, très bonne communication avec une volonté de développer la compréhension des élèves. Le formateur a su rythmer la formation de manière pertinente et jamais ennuyante !

PSM - Stéphane B.

Super formation – très bien préparée et animée

Power BI - Marie F.

Très intéressant ! Merci pour cette formation !

Power BI - Manon L.

Machine Learning avancée

Inter ou Intra

Présentiel ou distanciel

Sur-mesure

Objectifs

Pre-requis

Public visé

Programme

Modalités de déroulement

Méthode et moyens mobilisés

Modalités d'accès

Accessibilité aux personnes en situation de handicap

Satisfaction stagiaire

Stagiaires en 2023

Heures de formation

Témoignages clients

Vous avez un projet de formation ?
Vous souhaitez vous inscrire à une session inter-entreprise
ou mettre en place une formation sur-mesure ?