Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Införandet
- Apache Beam jämfört med MapReduce, Spark Streaming, Kafka Streaming, Storm och Flink
Installera och konfigurera Apache Beam
Översikt över Apache Beam funktioner och arkitektur
- Beam-modell, SDK:er, Beam Pipeline-löpare
- Serverdelar för distribuerad bearbetning
Förstå Apache Beam Programming-modellen
- Så här körs en pipeline
Köra en exempelpipeline
- Förbereda en WordCount-pipeline
- Köra pipelinen lokalt
Designa en pipeline
- Planera strukturen, välja transformeringar och bestämma indata- och utdatametoderna
Skapa pipelinen
- Skriva drivrutinsprogrammet och definiera pipelinen
- Använda Apache Beam klasser
- Datauppsättningar, transformeringar, I/O, datakodning etc.
Köra pipelinen
- Köra pipelinen lokalt, på fjärrdatorer och i ett offentligt moln
- Att välja en löpare
- Löparspecifika konfigurationer
Testning och felsökning Apache Beam
- Använda texttips för att emulera statisk text
- Hantera Python pipelineberoenden
Bearbeta avgränsade och obundna datauppsättningar
- Fönster och utlösare
Gör dina pipelines återanvändbara och underhållsbara
Skapa nya datakällor och mottagare
- Apache Beam API för källa och mottagare
Integrera Apache Beam med andra Big Data system
- Apache Hadoop, Apache Spark, Apache Kafka
Felsökning
Sammanfattning och slutsats
Krav
- Erfarenhet av Python programmering.
- Erfarenhet av Linux-kommandoraden.
Publik
- Utvecklare
14 timmar
Vittnesmål (1)
Sufficient hands on, trainer is knowledgable