Tack för att du skickade din fråga! En av våra teammedlemmar kontaktar dig snart.
Tack för att du skickade din bokning! En av våra teammedlemmar kontaktar dig snart.
Kursplan
Introduktion
- Introduktion till molnbaserad beräkning och big data-lösningar
- Översikt över Apache Hadoop:s egenskaper och arkitektur
Ställa upp Hadoop
- Planera ett Hadoop-kluster (lokalt, i molnet etc.)
- Välja operativsystem och Hadoop-distribution
- Tilldela resurser (hårdvara, nätverk etc.)
- Ladda ner och installera programvaran
- Dimensionera klustret för flexibilitet
Arbeta med HDFS
- Förstå Hadoop Distributed File System (HDFS)
- Översikt över HDFS-kommandoöversikt
- Komma åt HDFS
- Utföra grundläggande filoperationer på HDFS
- Använda S3 som komplement till HDFS
Översikt över MapReduce
- Förstå dataflöde i MapReduce-ramverket
- Map, Shuffle, Sort och Reduce
- Demo: Beräkna högsta lönar
Arbeta med YARN
- Förstå resursledning i Hadoop
- Arbeta med ResourceManager, NodeManager och Application Master
- Schemalägga jobb under YARN
- Schemalägga för stora antal noder och kluster
- Demo: Jobbschemaläggning
Integrera Hadoop med Spark
- Ställa upp lagring för Spark (HDFS, Amazon S3, NoSQL etc.)
- Förstå Resilient Distributed Datasets (RDDs)
- Skapa ett RDD
- Implementera RDD-transformationer
- Demo: Implementera en textsökprogram för filmtitlar
Hantera ett Hadoop-kluster
- Övervaka Hadoop
- Säkra ett Hadoop-kluster
- Lägga till och ta bort noder
- Köra en prestandabenchmark
- Anpassa ett Hadoop-kluster för optimerad prestanda
- Backup, återhämtning och driftsbärande planering
- Försekring av hög tillgänglighet (HA)
Uppgradera och migrera ett Hadoop-kluster
- Beräkna arbetsbelastningskrav
- Uppgradera Hadoop
- Flytta från lokalt till molnet och vice versa
- Hantera misslyckanden
Felsöka
Sammanfattning och slutsats
Krav
- Systemadministratörs erfarenhet
- Erfarenhet av Linux-kommandorad
- Förståelse för big data-begrepp
Målgrupp
- Systemadministratörer
- DBA:er
35 Timmar
Vittnesmål (3)
Jag tyckte att det var praktiskt. Älskade att tillämpa den teoretiska kunskapen med praktiska exempel.
Aurelia-Adriana - Allianz Services Romania
Kurs - Python and Spark for Big Data (PySpark)
Maskintolkat
Det faktum att vi kunde ta med oss den mesta av informationen/kursen/presentationerna/övningarna som gjordes, så att vi kan gå igenom dem och eventuellt göra om det vi inte förstod första gången eller förbättra det vi redan har gjort.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskintolkat
mycket interaktivt...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskintolkat