Kursplan

Introduktion

  • Översikt över Spark och Hadoop funktioner och arkitektur
  • Förstå big data
  • Python grundläggande programmering

Komma igång

  • Konfigurera Python, Spark och Hadoop
  • Förstå datastrukturer i Python
  • Förstå PySpark API
  • Förstå HDFS och MapReduce

Integrera Spark och Hadoop med Python

  • Implementering av Spark RDD i Python
  • Bearbetar data med MapReduce
  • Skapa distribuerade datauppsättningar i HDFS

Machine Learning med Spark MLlib

Bearbetar Big Data med Spark Streaming

Arbeta med Recommender Systems

Arbeta med Kafka, Sqoop, Kafka och Flume

Apache Mahout med Spark och Hadoop

Felsökning

Sammanfattning och nästa steg

Krav

  • Erfarenhet av Spark och Hadoop
  • Python erfarenhet av programmering

Publik

  • Dataforskare
  • Utvecklare
 21 timmar

Antal deltagare



Price per participant

Vittnesmål (3)

Relaterade Kurser

Relaterade Kategorier