Tack för att du skickade din fråga! En av våra teammedlemmar kontaktar dig snart.
Tack för att du skickade din bokning! En av våra teammedlemmar kontaktar dig snart.
Kursplan
Introduktion
- Introduktion till molnbaserad beräkning och big data-lösningar
- Översikt över Apache Hadoop:s egenskaper och arkitektur
Ställa upp Hadoop
- Planera ett Hadoop-kluster (lokalt, i molnet etc.)
- Välja operativsystem och Hadoop-distribution
- Tilldela resurser (hårdvara, nätverk etc.)
- Ladda ner och installera programvaran
- Dimensionera klustret för flexibilitet
Arbeta med HDFS
- Förstå Hadoop Distributed File System (HDFS)
- Översikt över HDFS-kommandoöversikt
- Komma åt HDFS
- Utföra grundläggande filoperationer på HDFS
- Använda S3 som komplement till HDFS
Översikt över MapReduce
- Förstå dataflöde i MapReduce-ramverket
- Map, Shuffle, Sort och Reduce
- Demo: Beräkna högsta lönar
Arbeta med YARN
- Förstå resursledning i Hadoop
- Arbeta med ResourceManager, NodeManager och Application Master
- Schemalägga jobb under YARN
- Schemalägga för stora antal noder och kluster
- Demo: Jobbschemaläggning
Integrera Hadoop med Spark
- Ställa upp lagring för Spark (HDFS, Amazon S3, NoSQL etc.)
- Förstå Resilient Distributed Datasets (RDDs)
- Skapa ett RDD
- Implementera RDD-transformationer
- Demo: Implementera en textsökprogram för filmtitlar
Hantera ett Hadoop-kluster
- Övervaka Hadoop
- Säkra ett Hadoop-kluster
- Lägga till och ta bort noder
- Köra en prestandabenchmark
- Anpassa ett Hadoop-kluster för optimerad prestanda
- Backup, återhämtning och driftsbärande planering
- Försekring av hög tillgänglighet (HA)
Uppgradera och migrera ett Hadoop-kluster
- Beräkna arbetsbelastningskrav
- Uppgradera Hadoop
- Flytta från lokalt till molnet och vice versa
- Hantera misslyckanden
Felsöka
Sammanfattning och slutsats
Krav
- Systemadministratörs erfarenhet
- Erfarenhet av Linux-kommandorad
- Förståelse för big data-begrepp
Målgrupp
- Systemadministratörer
- DBA:er
35 timmar
Vittnesmål (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
practice tasks