Kursplan

Införandet

  • Översikt över funktioner och arkitektur i Spark och Hadoop
  • Förstå big data
  • Python Grunderna i programmering

Komma igång

  • Ställa in Python, Spark och Hadoop
  • Förstå datastrukturer i Python
  • Förstå PySpark API
  • Så här fungerar HDFS och MapReduce

Integrera Spark och Hadoop med Python

  • Implementera Spark RDD i Python
  • Bearbeta data med hjälp av MapReduce
  • Skapa distribuerade datamängder i HDFS

Machine Learning med Spark MLlib

Bearbetning Big Data med Spark Streaming

Arbeta med rekommendationssystem

Arbeta med Kafka, Sqoop, Kafka och Flume

Apache Mahout med Spark och Hadoop

Felsökning

Sammanfattning och nästa steg

Krav

  • Erfarenhet av Spark och Hadoop
  • Python Erfarenhet av programmering

Publik

  • Datavetare
  • Utvecklare
 21 timmar

Antal deltagare


Price per participant

Vittnesmål (3)

Upcoming Courses

Relaterade Kategorier