Informatique

Développer avec Spark

Prix : 2190€ ht
Durée : 21h - 3j

Inter ou Intra

Présentiel ou distanciel

Sur-mesure

Objectifs

Cette formation vous permettra de maîtriser les concepts fondamentaux de Spark.

Pre-requis

Bonnes connaissances du langage Java ou du langage Python

Public visé

Développeurs – Architectes

  • Module 1 : PRÉSENTATION D’APACHE SPARK

    Introduction et historique
    Les langages de programmation supportés par Spark (Scala, Python et Java)
    Comparaison avec l’environnement Apache Hadoop
    Les modules de Spark (Spark SQL, Spark Streaming, MLlib, GraphX )

    Module 2 : RESILIENT DISTRIBUTED DATASET (RDD)

    C’est quoi un RDD ?
    Créer, manipuler et réutiliser des RDD
    Accumulateurs et variables broadcastées
    Utiliser des partitions

    Module 3 : MANIPULER DES DONNÉES STRUCTURÉES AVEC SPARK SQL

    SQL, DataFrames et Datasets
    Les différents types de sources de données
    Interopérabilité avec les RDD
    Performance de Spark SQL
    JDBC/ODBC server et Spark SQL CLI

    Module 4 : SPARK SUR UN CLUSTER

    Les différents types d’architectures : Standalone, Apache Mesos ou Hadoop YARN
    Configurer un cluster en mode Standalone
    Packager une application avec ses dépendances
    Déployer des applications avec Spark-submit
    Dimensionner un cluster

    Module 5 : SPARK STREAMING ET L’ANALYSE EN TEMPS RÉEL DES DONNÉES

    C’est quoi Spark streaming ?
    C’est quoi Discretized Streams (DStreams)?
    Les différents types de sources
    Manipulation de l’API
    Comparaison avec Apache Storm

    Module 6 : MANIPULER DES GRAPHES AVEC GRAPHX

    C’est quoi GraphX ?
    Création de graphes
    Opérations sur les graphes
    Vertex and Edge RDD
    Différents algorithmes

    Module 7 : MACHINE LEARNING AVEC SPARK

    Introduction au Machine Learning
    Présentation de SparkML et MLlib
    Les algorithmes d’apprentissages disponibles
    Implémentations de ces différents algorithmes

  • Formation présentielle ou distancielle dispensée par un formateur expérimenté. La formation alterne des exposés théoriques, des démonstrations et la mise en pratique au travers d'exercices et de cas concrets.
  • Evaluation des acquis tout au long de la formation à travers des Tps, des Quizz ;
    Evaluation de satisfaction de fin de formation ;
    Attestation de fin de formation précisant les modules acquis et en cours d’acquisition ;
    Support de cours remis en fin de session.

  • Vous pouvez vous inscrire pour suivre une de nos formations jusqu'à la veille de la date de démarrage si la formation est financée directement par votre entreprise ET si le nombre maximum de participants n'est pas atteint. Si la formation est financée via un OPCO, vous devez au préalable avoir obtenu un accord de ce dernier.
  • Nos locaux sont accessibles aux Personnes à Mobilité Réduite PMR. De plus, nos conseillers sont disponibles pour vous accompagner dans vos démarches à travers nos partenaires. Nous sommes en mesure de mobiliser les expertises, les outils nécessaires pour vous accueillir, vous accompagner et vous former.
4,5/5

Satisfaction stagiaire

Univlearn obtient la note de 4,5 sur 5 pour les sessions de formation dispensées en 2023 et 2024.

6909

Stagiaires en 2023

Univlearn a formé un total de 6909 stagiaires au cours de l'année 2023,

8190

Heures de formation

Univlearn a assuré un total de 8190 heures de formation en inter et intra.

Témoignages clients

« Nécessaire » indique les champs nécessaires

Votre demande concerne :Nécessaire
Type de formation envisagé :
Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.