Kursplan

Big Data Översikt:

  • Vad är Big Data
  • Varför Big Data vinner popularitet
  • Big Data Fallstudier
  • Big Data Egenskaper
  • Lösningar att arbeta med Big Data.

Hadoop & dess komponenter:

  • Vad är Hadoop och vad är dess komponenter.
  • Hadoop Arkitektur och dess egenskaper hos data den kan hantera /process.
  • Kort om Hadoop Historik, företag som använder det och varför de har börjat använda det.
  • Hadoop Ramverk och dess komponenter - förklaras i detalj.
  • Vad är HDFS och Reads - Skriver till Hadoop distribuerat filsystem.
  • Hur man ställer in Hadoop Kluster i olika lägen- Fristående/Pseudo/Multi Node-kluster.

(Detta inkluderar att sätta upp ett Hadoop kluster i VirtualBox/KVM/VMware, nätverkskonfigurationer som måste undersökas noggrant, köra Hadoop Daemons och testa klustret).

  • Vad är Map Reduce framework och hur det fungerar.
  • Körkarta Reducera jobb på Hadoop kluster.
  • Förstå replikering, spegling och rackmedvetenhet i sammanhang med Hadoop kluster.

Hadoop Klusterplanering:

  • Hur du planerar ditt hadoop-kluster.
  • Förstå hårdvara-mjukvara för att planera ditt hadoop-kluster.
  • Förstå arbetsbelastningar och planera kluster för att undvika misslyckanden och prestera optimalt.

Vad är MapR och varför MapR:

  • Översikt över MapR och dess arkitektur.
  • Förståelse och användning av MapR Control System, MapR Volymer, ögonblicksbilder och speglar.
  • Planera ett kluster i MapR-sammanhang.
  • Jämförelse av MapR med andra distributioner och Apache Hadoop.
  • MapR-installation och klusterdistribution.

Klusterinställningar och administration:

  • Hantera tjänster, noder, ögonblicksbilder, spegelvolymer och fjärrkluster.
  • Förstå och hantera noder.
  • Förståelse för Hadoop komponenter, Installera Hadoop komponenter tillsammans med MapR Services.
  • Accessing Data om kluster inklusive via NFS Hantering av tjänster och noder.
  • Hantera data genom att använda volymer, hantera användare och grupper, hantera & tilldela roller till noder, driftsättning av avveckling av noder, klusteradministration och prestandaövervakning, konfigurera/ analysera och övervaka mätvärden för att övervaka prestanda, konfigurera och administrera MapR-säkerhet.
  • Förstå och arbeta med M7- Native storage för MapR-tabeller.
  • Klusterkonfiguration och inställning för optimal prestanda.

Klusteruppgradering och integration med andra inställningar:

  • Uppgradering av mjukvaruversion av MapR och typer av uppgradering.
  • Konfigurerar Mapr-kluster för att komma åt HDFS-kluster.
  • Konfigurera MapR-kluster på Amazon Elastic Mapreduce.

Alla ovanstående ämnen inkluderar demonstrationer och övningssessioner för att eleverna ska få praktisk erfarenhet av tekniken.

Krav

  • Grundläggande kunskaper i Linux FS
  • Grundläggande Java
  • Kunskap om Apache Hadoop (rekommenderas)
 28 timmar

Antal deltagare



Price per participant

Relaterade Kategorier