Tack för att du skickade din fråga! En av våra teammedlemmar kontaktar dig snart.
Tack för att du skickade din bokning! En av våra teammedlemmar kontaktar dig snart.
Kursplan
Översikt: Big Data
- Vad är Big Data
- Varför Big Data blir populärt
- Fallstudier om Big Data
- Karakteristiker för Big Data
- Lösningar för att arbeta med Big Data.
Hadoop och dess komponenter:
- Vad är Hadoop och vad är dess komponenter.
- Hadoop Arkitektur och dess egenskaper hos data det kan hantera/processa.
- Kort historik om Hadoop, företag som använder det och varför de började använda det.
- Hadoop Ramverk och dess komponenter - förklaras i detalj.
- Vad är HDFS och läs- och skrivoperationer till Hadoop Distributed File System.
- Hur man sätter upp Hadoop kluster i olika lägen - Stand-alone/Pseudo/Multi Node kluster.
(Detta inkluderar att sätta upp ett Hadoop kluster i VirtualBox/KVM/VMware, nätverksinställningar som måste granskas noggrant, köra Hadoop daemoner och testa klustret).
- Vad är Map Reduce ramverk och hur fungerar det.
- Körning av Map Reduce-jobb på Hadoop kluster.
- Förståelse av replikering, spegling och rack-medvetenhet i samband med Hadoop kluster.
Planering av Hadoop kluster:
- Hur man planerar ett hadoop kluster.
- Förståelse av hård- och mjukvara för att planera ett hadoop kluster.
- Förståelse av arbetsbelastningar och planering av kluster för att undvika fel och prestera optimalt.
Vad är MapR och varför MapR:
- Översikt över MapR och dess arkitektur.
- Förståelse och funktionssätt av MapR Control System, MapR Volumes, snapshots och speglingar.
- Planering av kluster i samband med MapR.
- Jämförelse av MapR med andra distributioner och Apache Hadoop.
- Installation och klusterdeployment av MapR.
Klusteruppsättning och administration:
- Hantering av tjänster, noder, snapshots, speglingar och fjärrkluster.
- Förståelse och hantering av noder.
- Förståelse av Hadoop komponenter, installation av Hadoop komponenter bredvid MapR tjänster.
- Accessing av data på kluster, inklusive via NFS, hantering av tjänster och noder.
- Hantering av data med volymer, hantering av användare och grupper, hantering och tilldelning av roller till noder, kommissionering och avkommissionering av noder, klusteradministration och prestandamätning, konfigurering/analys och övervakning av metriker för att övervaka prestanda, konfigurering och administration av MapR säkerhet.
- Förståelse och arbete med M7 - nativ lagring för MapR tabeller.
- Konfigurering och optimering av kluster för optimal prestanda.
Klusteruppgradering och integration med andra uppsättningar:
- Uppgradering av programvaruversion av MapR och typer av uppgradering.
- Konfigurering av Mapr-kluster för att komma åt HDFS-kluster.
- Sättning upp av MapR-kluster på Amazon Elastic Mapreduce.
Alla ovanstående ämnen inkluderar demonstrationer och praktiska övningar för att lärare ska få praktisk erfarenhet av teknologin.
Krav
- Grundläggande kunskap om Linux FS
- Grundläggande Java
- Kunskap om Apache Hadoop (rekommenderas)
28 timmar
Vittnesmål (1)
practical things of doing, also theory was served good by Ajay