Informatique

Machine Learning avancée

Objectifs

Comprendre la nature des problèmes traités par les techniques d’apprentissage automatique utilisées dans le Big Data

Pre-requis

Des connaissances solides en statistiques et en algorithmes sont exigées

Public visé

Ingénieurs et techniciens, Chefs de projet et toute personne ayant déjà été sensibilisée par la machine learning.

Programme

Module 1 : INTRODUCTION ET HISTORIQUE

  • Processus complet d’élaboration d’un modèle prédictif

Module 2 : ARBRES DE DÉCISION

  • L’apprentissage par partitionnement
  • Construction d’un arbre de décision sur un jeu de données synthétique
  • Principaux points à considérer lors de l’induction d’un arbre de décision à partir de données
  • CHAID, C4.5 et CART : Les trois principales méthodes d’induction d’arbres proposés dans les logiciels
  • Les différences et les points communs

Module 3 : ARBRES DE RÉGRESSION

  • La régression par arbres
  • Une méthode non-linéaire de régression
  • Rapprochement avec les arbres de décision

Module 4 : ANALYSE DISCRIMINANTE PRÉDICTIVE

  • Un modèle paramétrique de discrimination
  • Analyse discriminante de Fisher
  • Évaluation globale du modèle
  • Évaluation individuelle des variables

Module 5 : RÉGRESSION LOGISTIQUE

  • Le modèle LOGIT
  • Estimation, évaluation globale et évaluation individuelle des variables
  • Régression logistique polytomique
  • Régression logistique lorsque la variable dépendante Y prend plus de 2 valeurs
  • Régression logistique multinomiale lorsque Y est nominale
  • Régression logistique polytomique ordinale lorsque Y est ordinale (odds adjacents, odds cumulatifs proportionnels)

Module 6 : CLASSIFIEUR BAYESIEN NAÏF (MODÈLE D’INDÉPENDANCE CONDITIONNELLE)

  • Principe de l’indépendance conditionnelle
  • Cas des prédicteurs continus
  • Cas des prédicteurs discrets
  • Construction d’un modèle explicite linéaire
  • Sélection de variables

Module 7 : BAGGING, RANDOM FOREST, BOOSTING

  • Méthodes ensemblistes basées sur des apprentissages répétés
  • Boosting : principe et variantes
  • Principe du Bagging
  • Random Forst : principe et variantes
  • Mesures d’importance des variables – Impact sur le biais et la variance des classifieurs

Module 8 : GRADIENT BOOSTING

  • Généralisation du boosting avec l’introduction explicite de fonctions de coûts
  • Importance du paramétrage

Module 9 : SUPPORT VECTOR MACHINE (SVM)

  • Principe de Machines à vecteurs de support ou Séparateur à Vaste Marge
  • Principe de la maximisation de la marge
  • Marge souple (soft margin)
  • Classifieurs linéaires et classifieurs non-linéaires avec l’astuce du noyau (kernel trick)
  • Fonction Noyau

Module 10 : RÉSEAUX DE NEURONES – PERCEPTRON SIMPLE ET MULTI-COUCHES

  • Introduction aux réseaux de neurones artificiels pour l’apprentissage supervisé
  • La Perceptron
  • Passage du modèle linéaire au modèle non-linéaire : le perceptron multicouche

Module 11 : APPRENTISSAGE NON SUPERVISÉ

  • Principe du clustering (K moyennes ou k means)
  • Principe de la Classification Ascendante Hiérarchique (CAH)
  • Règles d’association

Module 12 : DISCRÉTISATION DES VARIABLES QUANTITATIVES

  • Découpage en classe d’une variable quantitative
  • Méthodes non-supervisées et supervisées (chi-merge, mdlpc)

Module 13 : FILTRAGE DES VARIABLES

  • Approche FILTRE préalable à l’apprentissage supervisé
  • Techniques de classement (ranking)
  • Techniques de sélection basées sur la corrélation
  • Information mutuelle, entropie de Shannon, rapport de corrélation, lambda de Wilks

Module 14 : INDUCTION DE RÈGLES PRÉDICTIVES

  • Construction de bases de règles en analyse prédictive
  • Conversion des arbres en règles et algorithmes génétiques pour l’induction de règles

Module 15 : SCORING – LE CIBLAGE MARKETING

  • Le ciblage clientèle
  • Construction et lecture de la courbe LIFT (GAIN CHART)

Module 16 : ANALYSE RFM (RÉCENCE – FRÉQUENCE – MONTANT)

  • Segmentation RFM (récence-fréquence-montant)
  • Finalité, démarche, usage, variantes, limites

Module 17 : GRILLE DE SCORE

  • Élaboration de la grille de score à partir des résultats de la régression logistique
  • Méthode Disqual et scoring

Module 18 : INTÉGRATION DES COÛTS DE MAUVAIS CLASSEMENT EN APPRENTISSAGE SUPERVISÉ

  • Prise en compte des coûts pour l’évaluation et la construction des modèles prédictifs
  • Correction des règles d’affectation, techniques intégrées, bagging, la méthode MetaCost
  • Courbe ROC
  • Évaluation d’un classifieur à l’aide de la courbe ROC
  • Le critère AUC

Module 19 : QUELQUES MÉTHODES NON-PARAMÉTRIQUES DE DISCRIMINATION

  • Deux méthodes non-paramétriques de classement dérivés du schéma Bayesien la méthode des K-plus proches voisins et le modèle d’indépendance conditionnelle
  • Formation présentielle ou distancielle dispensée par un formateur expérimenté. La formation alterne des exposés théoriques, des démonstrations et la mise en pratique au travers d'exercices et de cas concrets.
  • Evaluation des acquis tout au long de la formation à travers des Tps, des Quizz ;
    Evaluation de satisfaction de fin de formation ;
    Attestation de fin de formation précisant les modules acquis et en cours d’acquisition ;
    Support de cours remis en fin de session.

  • Vous pouvez vous inscrire pour suivre une de nos formations jusqu'à la veille de la date de démarrage si la formation est financée directement par votre entreprise ET si le nombre maximum de participants n'est pas atteint. Si la formation est financée via un OPCO, vous devez au préalable avoir obtenu un accord de ce dernier.
  • Nos locaux sont accessibles aux Personnes à Mobilité Réduite PMR. De plus, nos conseillers sont disponibles pour vous accompagner dans vos démarches à travers nos partenaires. Nous sommes en mesure de mobiliser les expertises, les outils nécessaires pour vous accueillir, vous accompagner et vous former.

Prix par personne

1390 €

Durée

14h - 2J

Prochaines Sessions

Du 20 au 21 mars 2024

Vous avez un projet de formation ? Vous souhaitez vous inscrire à une session inter-entreprise ou mettre en place une formation sur-mesure ?