Kursplan

Införandet

Scala Programming Fördjupad granskning

 • Syntax och struktur
 • Flödeskontroll och funktioner

Spark Internals

 • Elastiska distribuerade datamängder (RDD)
 • Spark-skript för att skapa diagram till kluster

Översikt över Spark Streaming

 • Arkitektur för direktuppspelning
 • Intervall i streaming
 • Feltolerans

Förberedelse av utvecklingsmiljön

 • Installera och konfigurera Apache Spark
 • Installera och konfigurera Scala IDE
 • Installera och konfigurera JDK

Spark Streaming Nybörjare till Avancerad

 • Arbeta med nyckel-/värde-RDD:er
 • Filtrera RDD:er
 • Förbättra Spark-skript med reguljära uttryck
 • Dela data i ett kluster
 • Arbeta med nätverksdatauppsättningar
 • Implementera BFS-algoritmer
 • Skapa Spark-drivrutinsskript
 • Spårning i realtid med skript
 • Skriva kontinuerliga ansökningar
 • Strömmande linjär regression
 • Använda Spark Machine Learning-biblioteket

Spark och kluster

 • Paketera beroenden och Spark-skript med hjälp av SBT-verktyget
 • Använda journalsystem för att illustrera kluster
 • Optimera genom att partitionera RDD:er
 • Använda Spark-loggar

Integrering i Spark Streaming

 • Integrera Apache Kafka och arbeta med Kafka-ämnen
 • Integrera Apache Fume och arbeta med pull-baserade/push-baserade Flume-konfigurationer
 • Skriva en anpassad mottagarklass
 • Integrera Cassandra och exponera data som realtidstjänster

I produktion

 • Paketera ett program och köra det med Spark-Submit
 • Felsökning, justering och felsökning av Spark-jobb och kluster

Sammanfattning och slutsats

Krav

 • Programming och erfarenhet av skript

Publik

 • Programvaruingenjörer
 21 timmar

Antal deltagarePrice per participant

Vittnesmål (5)

Relaterade Kurser

Relaterade Kategorier