Kursplan
Introduktion till Apache Spark
- Sparks roll i big data-bearbetning
- Spark-arkitektur och dess komponenter
Inställning Apache Spark
- Krav på maskinvara och programvara
- Installationsprocedurer för fristående lägen och klusterlägen
- Metodtips för konfiguration för systemadministratörer
Administrera Spark-kluster
- Verktyg och tekniker för klusterhantering
- Övervaka Spark-program och klusterresurser
- Säkerhetskonfigurationer och användarhantering
Justering och optimering av prestanda
- Resursallokering och schemaläggning
- Justera Spark för optimal prestanda
- Identifiera och lösa vanliga flaskhalsar
Felsökning och problemlösning
- Vanliga utmaningar med Spark-administration
- Diagnostiska verktyg och tekniker för felsökning
- Steg-för-steg-metod för att lösa vanliga problem
- Metodtips för att upprätthålla en felfri Spark-miljö
Avancerade administrationsämnen
- Integration med andra big data-verktyg
- Säkerställa hög tillgänglighet och haveriberedskap
- Uppgradera och skala Spark-kluster
Sammanfattning och nästa steg
Krav
- Grundläggande kunskaper om nätverkskonfiguration och -hantering
- Kännedom om Linux operativsystem och kommandoradsgränssnitt
- Intresse för att lära sig mer om distribuerade datorsystem och hantering av stora datamängder
Publik
- Systemadministratörer
Vittnesmål (5)
Många praktiska exempel, olika sätt att närma sig samma problem, och ibland inte så uppenbara knep för att förbättra den nuvarande lösningen
Rafał - Nordea
Kurs - Apache Spark MLlib
Machine Translated
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
practice tasks