Hem
Big Data Utbildning
Hadoop Utbildning
Hadoop för administratörer Träningskurs

Hadoop för administratörer Träningskurs

Apache Hadoop är det mest populära ramverket för bearbetning av Big Data på klustren av servrar. På denna tre (eventuellt fyra) dagars kurs lär deltagarna sig om affärsfördelar och användningsområden för Hadoop och dess ekosystem, hur man planerar klusterdistribution och tillväxt, hur man installerar, underhåller, övervakar, felsöker och optimerar Hadoop. De kommer också att öva på massbelastning av klusterdata, bekanta sig med olika Hadoop-distributioner och öva på installation och hantering av Hadoop-ekosystemverktyg. Kursen avslutas med en diskussion om hur man säkrar klustret med Kerberos.

“…Materialet var mycket väl förberett och täckte grundligt. Laboratoriet var mycket användbart och väl organiserat”
— Andrew Nguyen, Principal Integration DW Engineer, Amazon Web Services

Målgrupp

Hadoop-administratörer

Format

Föreläsningar och praktiska laborationer, ungefär 60% föreläsningar och 40% laborationer.

Tack för att du skickade din fråga! En av våra teammedlemmar kontaktar dig snart.

Tack för att du skickade din bokning! En av våra teammedlemmar kontaktar dig snart.

Kursplan

Introduktion
- Hadoop historia, begrepp
- Ekosystem
- Distributioner
- Övergripande arkitektur
- Hadoop myter
- Hadoop utmaningar (hårdvara / mjukvara)
- Labbar: diskutera dina Big Data projekt och problem
Planering och installation
- Val av programvara, Hadoop distributioner
- Dimensionering av kluster, planering för tillväxt
- Val av hårdvara och nätverk
- Racktopologi
- Installation
- Multitenancy
- Katalogstruktur, loggar
- Benchmarking
- Labbar: klusterinstallation, kör prestandabenchmarks
HDFS-operationer
- Begrepp (horisontell skalbarhet, replikering, data-lokalitet, rack-medvetenhet)
- Noder och demoner (NameNode, Secondary NameNode, HA Standby NameNode, DataNode)
- Hälsövervakning
- Kommandorads- och webbaserad administration
- Tillägg av lagring, byte av defekta drivrutiner
- Labbar: bli bekant med HDFS-kommandorader
Datainsamling
- Flume för loggar och andra datainsamlingar till HDFS
- Sqoop för import från SQL databaser till HDFS, samt export tillbaka till SQL
- Hadoop datawarehousing med Hive
- Kopiering av data mellan kluster (distcp)
- Användning av S3 som komplement till HDFS
- Bästa praxis och arkitekturer för datainsamling
- Labbar: installera och använda Flume, samma för Sqoop
MapReduce-operationer och administration
- Parallelldatorns historia innan MapReduce: jämförelse mellan HPC och Hadoop administration
- MapReduce-klusterbelastningar
- Noder och demoner (JobTracker, TaskTracker)
- MapReduce UI-omgång
- MapReduce-konfiguration
- Jobbkonfiguration
- Optimering av MapReduce
- Så att det inte går fel med MR: vad man ska berätta för sina programmerare
- Labbar: köra MapReduce-exempel
YARN: ny arkitektur och nya möjligheter
- YARN-designmål och implementeringsarkitektur
- Nya aktörer: ResourceManager, NodeManager, Application Master
- Installation av YARN
- Jobbschema under YARN
- Labbar: undersöka jobbschema
Avancerade ämnen
- Hårdvarövervakning
- Klusterövervakning
- Tillägg och borttagning av servrar, uppgradering av Hadoop
- Säkerhetskopiering, återställning och planering för affärsfortsättning
- Oozie-jobbflöden
- Hadoop hög tillgänglighet (HA)
- Hadoop Federation
- Säkra ditt kluster med Kerberos
- Labbar: installera övervakning
Valbara spår
- Cloudera Manager för klusteradministration, övervakning och rutinuppgifter; installation, användning. I detta spår utförs alla övningar och labbar inom Cloudera-distributionen (CDH5)
- Ambari för klusteradministration, övervakning och rutinuppgifter; installation, användning. I detta spår utförs alla övningar och labbar inom Ambari-klusterhanteraren och Hortonworks Data Platform (HDP 2.0)

Krav

bekväm med grundläggande systemförvaltning
grundläggande skriptskickligheter

Kunskap om Hadoop och Distributed Computing är inte ett krav, men kommer att introduceras och förklaras under kursen.

Labbmiljö

Zero Install: Det finns ingen anledning att installera Hadoop-programvara på studenternas datorer! Ett fungerande Hadoop-kluster kommer att tillhandahållas för studenterna.

Studenterna behöver följande

en SSH-klient (Linux och Mac har redan ssh-klienter, för Windows rekommenderas Putty)
en webbläsare för att få åtkomst till klustret. Vi rekommenderar Firefox-webbläsaren med FoxyProxy-tillägg installerat

21 Timmar

Antal deltagare

Online

Klassrum

Välj Plats

Vänligen välj ett Föreläsningssal

Pris per deltagare

Öppna Utbildningskurser kräver 5+ deltagare.

Hadoop för administratörer Träningskurs - Bokning

Fullständigt namn *

E-post *

Telefonnummer *

Jobbtitel

Företagsnamn

Adress 1 *

Stad *

Län / Provins

Land *

Postnummer *

Startdatum

Moms-ID

Datum är beroende av tillgänglighet och äger rum mellan 09:30 och 16:30.

Betalning *

Banköverföring (Faktura, EK)

Debetkort / Kreditkort

Kommentarer

Villkor *

Jag är en auktoriserad representant för ovan nämnda kund och önskar boka de ovan nämnda kurserna eller tjänsterna i enlighet med NobleProgs villkor och personuppgiftspolicy.

Informera mig om rabatter och erbjudanden

Läs vår integritetspolicy för att se hur vi använder dina uppgifter

Hadoop för administratörer Träningskurs - Fråga

Fullständigt namn *

E-post *

Telefonnummer *

Antal deltagare

Företagsnamn

Företagsadress

Hur vill du delta på kursen?

Kundlokaler

Online

Klassrum

Kommentarer

Informera mig om rabatter och erbjudanden

Läs vår integritetspolicy för att se hur vi använder dina uppgifter

Hadoop för administratörer - Konsultfråga

Fullständigt namn *

Telefonnummer *

E-post *

Företagsnamn

Konsulttäcke *

Konsulmål

Vem kommer konsulten att arbeta med?

Konsultbrådskap *

Kommentarer

Informera mig om rabatter och erbjudanden

Läs vår integritetspolicy för att se hur vi använder dina uppgifter

Vittnesmål (1)

Praktiska övningar. Klassen hade egentligen sett ut att vara fem dagar lång, men de tre dagarna hjälpte till att klargöra många frågor som jag hade från att arbeta med NiFi.

James - BHG Financial

Kurs - Apache NiFi for Administrators

3000 EUR (Online)

3600 EUR (Klassrum)

Relaterade Kurser

Administratörsutbildning för Apache Hadoop

35 Timmar

Målgrupp:

Kurset riktar sig till IT-specialister som söker en lösning för att lagra och bearbeta stora datamängder i en distribuerad systemmiljö

Förkunskap:

Djup kunskap om Apache Zookeeper-administration.

LÄS MER...

Big Data Analytics in Health

21 Timmar

Big data analytics innebär processen med att granska stora mängder varierade datamängder för att upptäcka korrelationer, dolda mönster och andra användbara insikter.

Hälsosektorn har enorma mängder komplexa och heterogena medicinska och kliniska data. Att tillämpa big data analytics på hälsovårdsdata erbjuder stort potential för att härleda insikter som kan förbättra leveransen av hälso- och sjukvård. Men storleken på dessa datamängder utgör stora utmaningar i analysen och praktiska tillämpningar i en klinisk miljö.

I detta instruktörsledda, live-träning (distant), kommer deltagarna att lära sig hur man utför big data analytics inom hälsosektorn genom att gå igenom en serie praktiska övningar i ett laboratoriemiljö.

När kurserna är avslutade kommer deltagarna kunna:

Installera och konfigurera big data analytics-verktyg som Hadoop MapReduce och Spark
Förstå egenskaperna hos medicinska data
Tillämpa big data-tekniker för att hantera medicinska data
Studera big data-system och algoritmer i sammanhanget av hälsoapplikationer

Målgrupp

Utvecklare
Data vetenskapsmän

Kursformat

Delen föreläsning, delen diskussion, övningar och mycket praktisk handledning.

Notering

För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna det.

LÄS MER...

Hadoop för utvecklare (4 dagar)

28 Timmar

Apache Hadoop är den mest populära ramverket för att bearbeta stora datamängder på servrar. Denna kurs kommer att introducera en utvecklare till olika komponenter i Hadoop-ekosystemet (HDFS, MapReduce, Pig, Hive och HBase).

LÄS MER...

Avancerad Hadoop för utvecklare

21 Timmar

Apache Hadoop är en av de mest populära ramverken för bearbetning av stora datamängder på servrarkluster. Denna kurs går djupet in i datahantering i HDFS, avancerad Pig, Hive och HBase. Dessa avancerade programmeringstekniker kommer att vara till nytta för erfarna Hadoop-utvecklare.

Målgrupp: utvecklare

Varaktighet: tre dagar

Format: föreläsningar (50%) och praktiska övningar (50%).

LÄS MER...

Hadoop Administration på MapR

28 Timmar

Målgrupp:

Den här kursen syftar till att förklara big data/hadoop-teknik och visa att den inte är svår att förstå.

LÄS MER...

Hadoop och Spark för Administratörer

35 Timmar

Denna instruktörssvärd, liveutbildning i Sverige (online eller på plats) riktas till systemadministratörer som vill lära sig hur man sätter upp, distribuerar och hanterar Hadoop-kluster inom deras organisation.

Till slut av denna utbildning kommer deltagarna att kunna:

Installera och konfigurera Apache Hadoop.
Förstå de fyra huvudkomponenterna i Hadoop-ekosystemet: HDFS, MapReduce, YARN och Hadoop Common.
Använda Hadoop Distributed File System (HDFS) för att skala ett kluster till hundra eller tusen noder.
Ställ in HDFS som lagringsslänk för lokala Spark-distributioner.
Ställ in Spark för att komma åt alternativa lagringslösningar såsom Amazon S3 och NoSQL-databasystem som Redis, Elasticsearch, Couchbase, Aerospike etc.
Framföra administrativa uppgifter som tilldelning, hantering, övervakning och säkring av ett Apache Hadoop-kluster.

LÄS MER...

HBase för Utvecklare

21 Timmar

Denna kurs introducerar HBase – en NoSQL-databas ovanpå Hadoop. Kursen är avsedd för utvecklare som kommer att använda HBase för att utveckla applikationer, och administratörer som kommer att hantera HBase-kluster.

Vi leder en utvecklare genom HBase-arkitektur, datamodellering och applikationsutveckling med HBase. Kursen diskuterar också användningen av MapReduce med HBase, samt några administrativa ämnen relaterade till prestandaoptimering. Kursen är mycket praktisk med många laborationer.

Varaktighet: 3 dagar

Målgrupp: Utvecklare & Administratörer

LÄS MER...

Apache NiFi för Administratörer

21 Timmar

Apache NiFi är ett öppen-källkodat, flödesbaserat plattform för dataintegrering och händelsebehandling. Det möjliggör automatiserad, realtidsdataflöde, transformation och systemmedling mellan olika system, med en webbaserad användargränssnitts-UI och detaljerad kontroll.

Denna instruktörledd träningskurs (platsutbildning eller fjärrutbildning) riktar sig till mellannivåadministratörer och ingenjörer som vill distribuera, hantera, säkra och optimera NiFi-dataflöden i produktionsmiljöer.

Till slutet av denna utbildning kommer deltagarna att kunna:

Installera, konfigurera och underhålla Apache NiFi-kluster.
Utforma och hantera dataflöden från olika källor och mottagare.
Implementera flödesautomatisering, routning och transformering.
Optimera prestanda, övervaka operationer och felsöka problem.

Kursformat

Interaktiv föreläsning med diskussion om verkliga arkitekturer.
Praktiska övningar: bygga, distribuera och hantera flöden.
Situationsspecifika uppgifter i ett live-labbmiljö.

Kursanpassningsalternativ

För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.

LÄS MER...

Apache NiFi för Utvecklare

7 Timmar

I denna instruktörsledda, liveträning i Sverige kommer deltagarna att lära sig grunderna i flödesbaserad programmering när de utvecklar ett antal demotillägg, komponenter och processorer med hjälp av Apache NiFi.

I slutet av denna utbildning kommer deltagarna att kunna:

Förstå NiFi:s arkitektur och dataflödesbegrepp.
Utveckla tillägg med NiFi och API:er från tredje part.
Skräddarsy sin egen Apache Nifi-processor.
Mata in och bearbeta realtidsdata från olika och ovanliga filformat och datakällor.

LÄS MER...

Python, Spark och Hadoop för Big Data

21 Timmar

Den här instruktörsledda, liveutbildningen i Sverige (online eller på plats) riktar sig till utvecklare som vill använda och integrera Spark, Hadoop och Python för att bearbeta, analysera och transformera stora och komplexa datamängder.

I slutet av denna utbildning kommer deltagarna att kunna:

Konfigurera den miljö som krävs för att börja bearbeta stordata med Spark, Hadoop och Python.
Förstå funktionerna, kärnkomponenterna och arkitekturen i Spark och Hadoop.
Lär dig hur du integrerar Spark, Hadoop och Python för bearbetning av stordata.
Utforska verktygen i Spark-ekosystemet (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka och Flume).
Skapa rekommendationssystem för samarbetsfiltrering som liknar Netflix, YouTube, Amazon, Spotify och Google.
Använd Apache Mahout för att skala maskininlärningsalgoritmer.

LÄS MER...

Hadoop för administratörer Träningskurs

Målgrupp

Format

Kursplan

Krav

Labbmiljö

Vittnesmål (1)

James - BHG Financial

Kurs - Apache NiFi for Administrators

Kommande Kurser

Hadoop för administratörer

Hadoop för administratörer

Hadoop för administratörer

Hadoop för administratörer

Hadoop för administratörer

Relaterade Kategorier

Denna webbplats i andra länder/regioner

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites