Apache Spark

Apache spark ……………

Formation I. Découverte du framework Apache Spark

3 jours - Niveau : ⦿⦿⦾⦾⦾

Objectifs

Cette formation vise à …

Public concerné

……

Prérequis

……

Modalités pédagogiques

Apport théorique et mise en pratique à travers des cas concrets.

Méthode d'évaluation

Quizz en fin de chapitres, examen technique

Plan de la formation

  • Tour d'horizon d'Apache Spark
    • Historique
    • Relation avec Hadoop
    • Modèle d'exécution
    • Cas d'utilisation
  • Architecture de Spark
    • RDD : Resilient Data Set
    • Dataframes
    • Spark driver
    • Job
    • Executor
    • Task
    • Intégration
      • Kubernetes
      • Mesos
      • YARN
      • Docker
      • EC2
      • OpenStack
  • Prise en main
    • Installation
    • Première application avec Spark Shell
    • Lecture de données
    • Opérations et transformations
    • Ecriture HDFS
  • Modules supplémentaires
    • Spark Streaming
    • Spark SQL
    • Spark MLib
    • Spark R
    • GraphX
  • Intégration
    • Hadoop Hive
    • Hadoop HBase