Kursplan

Införandet

Översikt över Spark Streaming funktioner och arkitektur

  • Datakällor som stöds
  • Kärn-API:er

Att förbereda miljön

  • Beroenden
  • Spark- och strömningskontext
  • Ansluta till Kafka

Bearbeta meddelanden

  • Parsa inkommande meddelanden som JSON
  • ETL-processer
  • Starta strömningskontexten

Utföra en fönstermålning Stream Processing

  • Intervall för glidning
  • Konfiguration av kontrollpunktsleverans
  • Starta miljön

Skapa en prototyp av bearbetningskoden

  • Ansluta till ett Kafka-ämne
  • Hämta JSON från datakällan med hjälp av Paw
  • Variationer och ytterligare bearbetning

Strömma koden

  • Variabler för jobbkontroll
  • Definiera värden som ska matchas
  • Funktioner och villkor

Hämta strömutdata

  • Räknare
  • Kafka-utdata (matchade och icke-matchade)

Felsökning

Sammanfattning och slutsats

Krav

  • Erfarenhet av Python och Apache Kafka
  • Kännedom om plattformar för strömbearbetning

Publik

  • Datatekniker
  • Datavetare
  • Programmerare
 7 timmar

Antal deltagare


Price per participant

Vittnesmål (5)

Upcoming Courses

Relaterade Kategorier