Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Översikt: Big Data
- Vad är Big Data
- Varför Big Data blir populärt
- Fallstudier om Big Data
- Karakteristiker för Big Data
- Lösningar för att arbeta med Big Data.
Hadoop och dess komponenter:
- Vad är Hadoop och vad är dess komponenter.
- Hadoop Arkitektur och dess egenskaper hos data det kan hantera/processa.
- Kort historik om Hadoop, företag som använder det och varför de började använda det.
- Hadoop Ramverk och dess komponenter - förklaras i detalj.
- Vad är HDFS och läs- och skrivoperationer till Hadoop Distributed File System.
- Hur man sätter upp Hadoop kluster i olika lägen - Stand-alone/Pseudo/Multi Node kluster.
(Detta inkluderar att sätta upp ett Hadoop kluster i VirtualBox/KVM/VMware, nätverksinställningar som måste granskas noggrant, köra Hadoop daemoner och testa klustret).
- Vad är Map Reduce ramverk och hur fungerar det.
- Körning av Map Reduce-jobb på Hadoop kluster.
- Förståelse av replikering, spegling och rack-medvetenhet i samband med Hadoop kluster.
Planering av Hadoop kluster:
- Hur man planerar ett hadoop kluster.
- Förståelse av hård- och mjukvara för att planera ett hadoop kluster.
- Förståelse av arbetsbelastningar och planering av kluster för att undvika fel och prestera optimalt.
Vad är MapR och varför MapR:
- Översikt över MapR och dess arkitektur.
- Förståelse och funktionssätt av MapR Control System, MapR Volumes, snapshots och speglingar.
- Planering av kluster i samband med MapR.
- Jämförelse av MapR med andra distributioner och Apache Hadoop.
- Installation och klusterdeployment av MapR.
Klusteruppsättning och administration:
- Hantering av tjänster, noder, snapshots, speglingar och fjärrkluster.
- Förståelse och hantering av noder.
- Förståelse av Hadoop komponenter, installation av Hadoop komponenter bredvid MapR tjänster.
- Accessing av data på kluster, inklusive via NFS, hantering av tjänster och noder.
- Hantering av data med volymer, hantering av användare och grupper, hantering och tilldelning av roller till noder, kommissionering och avkommissionering av noder, klusteradministration och prestandamätning, konfigurering/analys och övervakning av metriker för att övervaka prestanda, konfigurering och administration av MapR säkerhet.
- Förståelse och arbete med M7 - nativ lagring för MapR tabeller.
- Konfigurering och optimering av kluster för optimal prestanda.
Klusteruppgradering och integration med andra uppsättningar:
- Uppgradering av programvaruversion av MapR och typer av uppgradering.
- Konfigurering av Mapr-kluster för att komma åt HDFS-kluster.
- Sättning upp av MapR-kluster på Amazon Elastic Mapreduce.
Alla ovanstående ämnen inkluderar demonstrationer och praktiska övningar för att lärare ska få praktisk erfarenhet av teknologin.
Krav
- Grundläggande kunskap om Linux FS
- Grundläggande Java
- Kunskap om Apache Hadoop (rekommenderas)
28 timmar
Vittnesmål (1)
practical things of doing, also theory was served good by Ajay