Kursplan

Översikt: Big Data

  • Vad är Big Data
  • Varför Big Data blir populärt
  • Fallstudier om Big Data
  • Karakteristiker för Big Data
  • Lösningar för att arbeta med Big Data.

Hadoop och dess komponenter:

  • Vad är Hadoop och vad är dess komponenter.
  • Hadoop Arkitektur och dess egenskaper hos data det kan hantera/processa.
  • Kort historik om Hadoop, företag som använder det och varför de började använda det.
  • Hadoop Ramverk och dess komponenter - förklaras i detalj.
  • Vad är HDFS och läs- och skrivoperationer till Hadoop Distributed File System.
  • Hur man sätter upp Hadoop kluster i olika lägen - Stand-alone/Pseudo/Multi Node kluster.

(Detta inkluderar att sätta upp ett Hadoop kluster i VirtualBox/KVM/VMware, nätverksinställningar som måste granskas noggrant, köra Hadoop daemoner och testa klustret).

  • Vad är Map Reduce ramverk och hur fungerar det.
  • Körning av Map Reduce-jobb på Hadoop kluster.
  • Förståelse av replikering, spegling och rack-medvetenhet i samband med Hadoop kluster.

Planering av Hadoop kluster:

  • Hur man planerar ett hadoop kluster.
  • Förståelse av hård- och mjukvara för att planera ett hadoop kluster.
  • Förståelse av arbetsbelastningar och planering av kluster för att undvika fel och prestera optimalt.

Vad är MapR och varför MapR:

  • Översikt över MapR och dess arkitektur.
  • Förståelse och funktionssätt av MapR Control System, MapR Volumes, snapshots och speglingar.
  • Planering av kluster i samband med MapR.
  • Jämförelse av MapR med andra distributioner och Apache Hadoop.
  • Installation och klusterdeployment av MapR.

Klusteruppsättning och administration:

  • Hantering av tjänster, noder, snapshots, speglingar och fjärrkluster.
  • Förståelse och hantering av noder.
  • Förståelse av Hadoop komponenter, installation av Hadoop komponenter bredvid MapR tjänster.
  • Accessing av data på kluster, inklusive via NFS, hantering av tjänster och noder.
  • Hantering av data med volymer, hantering av användare och grupper, hantering och tilldelning av roller till noder, kommissionering och avkommissionering av noder, klusteradministration och prestandamätning, konfigurering/analys och övervakning av metriker för att övervaka prestanda, konfigurering och administration av MapR säkerhet.
  • Förståelse och arbete med M7 - nativ lagring för MapR tabeller.
  • Konfigurering och optimering av kluster för optimal prestanda.

Klusteruppgradering och integration med andra uppsättningar:

  • Uppgradering av programvaruversion av MapR och typer av uppgradering.
  • Konfigurering av Mapr-kluster för att komma åt HDFS-kluster.
  • Sättning upp av MapR-kluster på Amazon Elastic Mapreduce.

Alla ovanstående ämnen inkluderar demonstrationer och praktiska övningar för att lärare ska få praktisk erfarenhet av teknologin.

Krav

  • Grundläggande kunskap om Linux FS
  • Grundläggande Java
  • Kunskap om Apache Hadoop (rekommenderas)
 28 timmar

Antal deltagare


Price per participant

Vittnesmål (1)

Upcoming Courses

Relaterade Kategorier