Kursplan

Introduktion

  • Introduktion till molnbaserad beräkning och big data-lösningar
  • Översikt över Apache Hadoop:s egenskaper och arkitektur

Ställa upp Hadoop

  • Planera ett Hadoop-kluster (lokalt, i molnet etc.)
  • Välja operativsystem och Hadoop-distribution
  • Tilldela resurser (hårdvara, nätverk etc.)
  • Ladda ner och installera programvaran
  • Dimensionera klustret för flexibilitet

Arbeta med HDFS

  • Förstå Hadoop Distributed File System (HDFS)
  • Översikt över HDFS-kommandoöversikt
  • Komma åt HDFS
  • Utföra grundläggande filoperationer på HDFS
  • Använda S3 som komplement till HDFS

Översikt över MapReduce

  • Förstå dataflöde i MapReduce-ramverket
  • Map, Shuffle, Sort och Reduce
  • Demo: Beräkna högsta lönar

Arbeta med YARN

  • Förstå resursledning i Hadoop
  • Arbeta med ResourceManager, NodeManager och Application Master
  • Schemalägga jobb under YARN
  • Schemalägga för stora antal noder och kluster
  • Demo: Jobbschemaläggning

Integrera Hadoop med Spark

  • Ställa upp lagring för Spark (HDFS, Amazon S3, NoSQL etc.)
  • Förstå Resilient Distributed Datasets (RDDs)
  • Skapa ett RDD
  • Implementera RDD-transformationer
  • Demo: Implementera en textsökprogram för filmtitlar

Hantera ett Hadoop-kluster

  • Övervaka Hadoop
  • Säkra ett Hadoop-kluster
  • Lägga till och ta bort noder
  • Köra en prestandabenchmark
  • Anpassa ett Hadoop-kluster för optimerad prestanda
  • Backup, återhämtning och driftsbärande planering
  • Försekring av hög tillgänglighet (HA)

Uppgradera och migrera ett Hadoop-kluster

  • Beräkna arbetsbelastningskrav
  • Uppgradera Hadoop
  • Flytta från lokalt till molnet och vice versa
  • Hantera misslyckanden

Felsöka

Sammanfattning och slutsats

Krav

  • Systemadministratörs erfarenhet
  • Erfarenhet av Linux-kommandorad
  • Förståelse för big data-begrepp

Målgrupp

  • Systemadministratörer
  • DBA:er
 35 timmar

Antal deltagare


Pris per deltagare

Vittnesmål (5)

Kommande Kurser

Relaterade Kategorier