Kursplan
Introduktion till Apache Spark
- Sparks roll i big data-bearbetning
- Spark-arkitektur och dess komponenter
Inställning Apache Spark
- Krav på maskinvara och programvara
- Installationsprocedurer för fristående lägen och klusterlägen
- Metodtips för konfiguration för systemadministratörer
Administrera Spark-kluster
- Verktyg och tekniker för klusterhantering
- Övervaka Spark-program och klusterresurser
- Säkerhetskonfigurationer och användarhantering
Justering och optimering av prestanda
- Resursallokering och schemaläggning
- Justera Spark för optimal prestanda
- Identifiera och lösa vanliga flaskhalsar
Felsökning och problemlösning
- Vanliga utmaningar med Spark-administration
- Diagnostiska verktyg och tekniker för felsökning
- Steg-för-steg-metod för att lösa vanliga problem
- Metodtips för att upprätthålla en felfri Spark-miljö
Avancerade administrationsämnen
- Integration med andra big data-verktyg
- Säkerställa hög tillgänglighet och haveriberedskap
- Uppgradera och skala Spark-kluster
Sammanfattning och nästa steg
Krav
- Grundläggande kunskaper om nätverkskonfiguration och -hantering
- Kännedom om Linux operativsystem och kommandoradsgränssnitt
- Intresse för att lära sig mer om distribuerade datorsystem och hantering av stora datamängder
Publik
- Systemadministratörer
Vittnesmål (5)
Det faktum att vi kunde ta med oss den mesta av informationen/kursen/presentationerna/övningarna som gjordes, så att vi kan gå igenom dem och eventuellt göra om det vi inte förstod första gången eller förbättra det vi redan har gjort.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskintolkat
mycket interaktivt...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskintolkat
Tillräckligt praktiskt, utbildaren är kunskapssam
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maskintolkat
Få lära dig Spark Streaming, Databricks och AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maskintolkat
övningsuppgifter
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maskintolkat