Kursplan

Introduktion till Apache Spark

  • Sparks roll i big data-bearbetning
  • Spark-arkitektur och dess komponenter

Inställning Apache Spark

  • Krav på maskinvara och programvara
  • Installationsprocedurer för fristående lägen och klusterlägen
  • Metodtips för konfiguration för systemadministratörer

Administrera Spark-kluster

  • Verktyg och tekniker för klusterhantering
  • Övervaka Spark-program och klusterresurser
  • Säkerhetskonfigurationer och användarhantering

Justering och optimering av prestanda

  • Resursallokering och schemaläggning
  • Justera Spark för optimal prestanda
  • Identifiera och lösa vanliga flaskhalsar

Felsökning och problemlösning

  • Vanliga utmaningar med Spark-administration
  • Diagnostiska verktyg och tekniker för felsökning
  • Steg-för-steg-metod för att lösa vanliga problem
  • Metodtips för att upprätthålla en felfri Spark-miljö

Avancerade administrationsämnen

  • Integration med andra big data-verktyg
  • Säkerställa hög tillgänglighet och haveriberedskap
  • Uppgradera och skala Spark-kluster

Sammanfattning och nästa steg

Krav

  • Grundläggande kunskaper om nätverkskonfiguration och -hantering
  • Kännedom om Linux operativsystem och kommandoradsgränssnitt
  • Intresse för att lära sig mer om distribuerade datorsystem och hantering av stora datamängder

Publik

  • Systemadministratörer
 35 timmar

Antal deltagare


Price per participant

Vittnesmål (5)

Upcoming Courses