Kursplan

Införandet

Scala Programming Fördjupad granskning

  • Syntax och struktur
  • Flödeskontroll och funktioner

Spark Internals

  • Elastiska distribuerade datamängder (RDD)
  • Spark-skript för att skapa diagram till kluster

Översikt över Spark Streaming

  • Arkitektur för direktuppspelning
  • Intervall i streaming
  • Feltolerans

Förberedelse av utvecklingsmiljön

  • Installera och konfigurera Apache Spark
  • Installera och konfigurera Scala IDE
  • Installera och konfigurera JDK

Spark Streaming Nybörjare till Avancerad

  • Arbeta med nyckel-/värde-RDD:er
  • Filtrera RDD:er
  • Förbättra Spark-skript med reguljära uttryck
  • Dela data i ett kluster
  • Arbeta med nätverksdatauppsättningar
  • Implementera BFS-algoritmer
  • Skapa Spark-drivrutinsskript
  • Spårning i realtid med skript
  • Skriva kontinuerliga ansökningar
  • Strömmande linjär regression
  • Använda Spark Machine Learning-biblioteket

Spark och kluster

  • Paketera beroenden och Spark-skript med hjälp av SBT-verktyget
  • Använda journalsystem för att illustrera kluster
  • Optimera genom att partitionera RDD:er
  • Använda Spark-loggar

Integrering i Spark Streaming

  • Integrera Apache Kafka och arbeta med Kafka-ämnen
  • Integrera Apache Fume och arbeta med pull-baserade/push-baserade Flume-konfigurationer
  • Skriva en anpassad mottagarklass
  • Integrera Cassandra och exponera data som realtidstjänster

I produktion

  • Paketera ett program och köra det med Spark-Submit
  • Felsökning, justering och felsökning av Spark-jobb och kluster

Sammanfattning och slutsats

Krav

  • Programming och erfarenhet av skript

Publik

  • Programvaruingenjörer
 21 timmar

Antal deltagare


Price per participant

Vittnesmål (5)

Upcoming Courses

Relaterade Kategorier