Kursplan

Big Data Översikt:

  • Vad är Big Data
  • Varför Big Data ökar i popularitet
  • Big Data Fallstudier
  • Big Data Egenskaper
  • Lösningar att arbeta med Big Data.

Hadoop och dess komponenter:

  • Vad är Hadoop och vilka är dess komponenter.
  • Hadoop Arkitektur och dess egenskaper hos data som den kan hantera /Process.
  • Kort om Hadoop Historia, företag som använder det och varför de har börjat använda det.
  • Hadoop Ram och dess komponenter - förklaras i detalj.
  • Vad är HDFS och läser -skriver till Hadoop distribuerat filsystem.
  • Så här ställer du in Hadoop kluster i olika lägen – fristående/pseudo/multinodkluster.

(Detta inkluderar att sätta upp ett Hadoop kluster i VirtualBox/KVM/VMware, nätverkskonfigurationer som måste undersökas noggrant, köra Hadoop demoner och testa klustret).

  • Vad är Map Reduce-ramverket och hur fungerar det.
  • Köra kartreduktionsjobb i Hadoop-klustret.
  • Förstå replikering, spegling och rackmedvetenhet i kontexten av Hadoop kluster.

Hadoop Klusterplanering:

  • Så här planerar du ditt hadoop-kluster.
  • Förstå maskinvara och programvara för att planera ditt Hadoop-kluster.
  • Förstå arbetsbelastningar och planera kluster för att undvika fel och prestera optimalt.

Vad är MapR och varför MapR:

  • Översikt över MapR och dess arkitektur.
  • Förståelse och funktion av MapR Styrsystem, MapR-volymer, snapshots och speglar.
  • Planera ett kluster i samband med MapR.
  • Jämförelse av MapR med andra distributioner och Apache Hadoop.
  • MapR-installation och klusterdistribution.

Klusterkonfiguration och administration:

  • Hantering av tjänster, noder, snapshots, spegelvolymer och fjärrkluster.
  • Förstå och hantera noder.
  • Förståelse för Hadoop komponenter, installation av Hadoop komponenter tillsammans med MapR-tjänster.
  • Accessing Data på kluster inklusive via NFS-hantering av tjänster och noder.
  • Hantering av data med hjälp av volymer, hantering av användare och grupper, hantering och tilldelning av roller till noder, driftsättning av avveckling av noder, klusteradministration och prestandaövervakning, konfiguration/analys och övervakning av mätvärden för att övervaka prestanda, konfiguration och administration av MapR-säkerhet.
  • Förstå och arbeta med M7- Inbyggd lagring för MapR-tabeller.
  • Klusterkonfiguration och justering för optimala prestanda.

Klusteruppgradering och integrering med andra konfigurationer:

  • Uppgradering av programvaruversion av MapR och typer av uppgraderingar.
  • Konfigurera Mapr-kluster för åtkomst till HDFS-kluster.
  • Konfigurera MapR-kluster på Amazon Elastic Mapreduce.

Alla ovanstående ämnen inkluderar: Demonstrationer och övningssessioner för att eleverna ska få praktisk erfarenhet av tekniken.

Krav

  • Grundläggande kunskaper i Linux FS
  • Grundläggande Java
  • Kunskap om Apache Hadoop (rekommenderas)
 28 timmar

Antal deltagare


Price per participant

Vittnesmål (1)

Upcoming Courses