Hadoop Administration Träningskurs
Kursen ägnas åt IT-specialister som letar efter en lösning för att lagra och bearbeta stora datamängder i distribuerad systemmiljö
Kursmål:
Få kunskap om Hadoop klusteradministration
Kursplan
-
Introduktion till Cloud Computing och Big Data lösningar
-
Apache Hadoop utveckling: HDFS, MapReduce, YARN
-
Installation och konfiguration av Hadoop i pseudodistribuerat läge
-
Köra MapReduce-jobb i Hadoop-kluster
-
Hadoop Planering, installation och konfiguration av kluster
-
Hadoop ekosystem: Gris, Hive, Sqoop, HBase
- Big Data Framtid: Impala, Cassandra
Krav
- grundläggande Linux administrativa färdigheter
- grundläggande programmeringskunskaper
Open Training Courses require 5+ participants.
Hadoop Administration Träningskurs - Booking
Hadoop Administration Träningskurs - Enquiry
Hadoop Administration - Consultancy Enquiry
Vittnesmål (5)
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Kurs - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurs - Impala for Business Intelligence
practical things of doing, also theory was served good by Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurs - Hadoop Administration on MapR
Liked very much the interactive way of learning.
Luigi Loiacono
Kurs - Data Analysis with Hive/HiveQL
I mostly liked the trainer giving real live Examples.
Simon Hahn
Kurs - Administrator Training for Apache Hadoop
Upcoming Courses
Relaterade Kurser
Hortonworks Data Platform (HDP) for Administrators
21 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) introducerar Hortonworks Data Platform (HDP) och leder deltagarna genom implementeringen av Spark + Hadoop-lösningen.
I slutet av denna utbildning kommer deltagarna att kunna:
- Använd Hortonworks för att tillförlitligt köra Hadoop i stor skala. Förena Hadoops funktioner för säkerhet, styrning och drift med Sparks agila analytiska arbetsflöden. Använd Hortonworks för att undersöka, validera, certifiera och stödja var och en av komponenterna i ett Spark-projekt. Bearbeta olika typer av data, inklusive strukturerad, ostrukturerad, i rörelse och i vila.
Apache Ambari: Efficiently Manage Hadoop Clusters
21 timmarApache Ambari är en open source-managementplattform för att tillhandahålla, hantera, övervaka och säkra Apache Hadoop kluster.
I denna instruktörsledda liveträning kommer deltagarna att lära sig hanteringsverktygen och praxis som Ambari tillhandahåller för att framgångsrikt hantera Hadoop kluster.
I slutet av denna träning kommer deltagarna att kunna:
- Ställ in ett live Big Data kluster med Ambari
- Använd Ambaris avancerade funktioner och funktioner i olika användningsfall
- Lägg till och ta bort noder sömlöst efter behov
- Förbättra ett Hadoop klustrets prestanda genom att ställa in och justera
Publik
- DevOps
- Systemadministratörer
- databasadministratörer
- Hadoop testare
Kursformat
- Delföreläsning, delvis diskussion, övningar och tung praktisk övning
Impala for Business Intelligence
21 timmarCloudera Impala är en frågemotor för massiv parallell bearbetning (MPP) SQL med öppen källkod för Apache Hadoop-kluster.
Impala gör det möjligt för användare att skicka frågor med låg latens SQL till data lagrade i Hadoop Distributed File System och Apache Hbase utan att kräva dataförflyttning eller transformation.
Publik
Den här kursen vänder sig till analytiker och datavetare som utför analys av data lagrad i Hadoop via Business Intelligence eller SQL verktyg.
Efter denna kurs kommer delegater att kunna
- Extrahera meningsfull information från Hadoop-kluster med Impala. Skriv specifika program för att underlätta Business Intelligence i Impala SQL Dialect. Felsöka Impala.
Data Analysis with Hive/HiveQL
7 timmarDenna kurs behandlar hur man använder Hive SQL språk (AKA: Hive HQL, SQL på Hive , Hive QL) för personer som extraherar data från Hive
Administrator Training for Apache Hadoop
35 timmarPublik:
Kursen är avsedd för IT-specialister som letar efter en lösning för att lagra och bearbeta stora datamängder i en distribuerad systemmiljö
Go al:
Djup kunskap om Hadoop klusteradministration.
Hadoop Administration on MapR
28 timmarPublik:
Denna kurs är avsedd att avmystifiera big data / hadoop-teknik och för att visa att det inte är svårt att förstå.
Hadoop for Developers (4 days)
28 timmarApache Hadoop är den mest populära ramen för behandling av Big Data på kluster av servrar. Denna kurs kommer att introducera en utvecklare för olika komponenter (HDFS, MapReduce, Pig, Hive och HBase) Hadoop ekosystem.
Advanced Hadoop for Developers
21 timmarApache Hadoop är en av de mest populära ramarna för bearbetning av Big Data på kluster av servrar. Denna kurs omfattar datahantering i HDFS, avancerad gris, Hive och HBase. Dessa avancerade programmeringstekniker kommer att vara fördelaktiga för erfarna Hadoop utvecklare.
Publik : utvecklare
Varaktighet: tre dagar
Format: föreläsningar (50%) och praktiska labb (50%).
HBase for Developers
21 timmarDenna kurs introducerar HBase - en No SQL butik ovanpå Hadoop . Kursen är avsedd för utvecklare som kommer att använda HBase för att utveckla applikationer, och administratörer som kommer att hantera HBase-kluster.
Vi kommer att gå en utvecklare genom HBase-arkitektur och datamodellering och applikationsutveckling på HBase. Det kommer också att diskutera att använda MapReduce med HBase, och några administrationsämnen, relaterade till prestandaoptimering. Kursen är mycket praktisk med massor av labbövningar.
Varaktighet : 3 dagar
Publik : Utvecklare och administratörer
Hadoop For Administrators
21 timmarApache Hadoop är den mest populära ramen för behandling av Big Data på kluster av servrar. I den här tre (valfritt, fyra) dagars kurs kommer deltagarna att lära sig om affärsfördelarna och använda fall för Hadoop och dess ekosystem, hur man planerar distribution och tillväxt av kluster, hur man installerar, underhåller, övervakar, felsöker och optimerar Hadoop . De kommer också att öva kluster bulk data belastning, bekanta sig med olika Hadoop distributioner och öva på att installera och hantera Hadoop ekosystemverktyg. Kursen avslutas med diskussion om att säkra kluster med Kerberos.
”... Materialen var mycket väl förberedda och täckta noggrant. Laben var mycket hjälpsam och välorganiserad ”
- Andrew Nguyen, Principal Integration DW Engineer, Microsoft Online Advertising
Publik
Hadoop administratörer
Formatera
Föreläsningar och praktiska labb, ungefärligt balans 60% föreläsningar, 40% labb.
Hadoop for Developers and Administrators
21 timmarHadoop for Project Managers
14 timmarI denna instruktörsledda utbildning i Sverige kommer deltagarna att lära sig kärnkomponenterna i ekosystemet Hadoop och hur dessa tekniker kan användas för att lösa storskaliga problem. Genom att lära sig dessa grunder kommer deltagarna att förbättra sin förmåga att kommunicera med utvecklarna och implementerarna av dessa system samt de datavetare och analytiker som många IT-projekt involverar.
Publik
- Projektledare som vill implementera Hadoop i sin befintliga utvecklings- eller IT-infrastruktur
- Projektledare som behöver kommunicera med tvärfunktionella team som inkluderar big data-ingenjörer, datavetare och affärsanalytiker
Samza for Stream Processing
14 timmarApache Samza är en öppen källkod, nästan realtid, asynkron beräkningsram för strömbehandling. Den använder Apache Kafka för meddelanden och Apache Hadoop YARN för feltolerans, processorisolering, säkerhet och resurshantering.
Den här instruktörsledda, live-utbildningen introducerar principerna bakom meddelandesystem och distribuerad strömbearbetning, samtidigt som deltagarna går genom skapandet av ett exempel på Samza-baserat projekt och jobbutförande.
I slutet av denna träning kommer deltagarna att kunna:
- Använd Samza för att förenkla koden som behövs för att producera och konsumera meddelanden.
- Koppla bort hanteringen av meddelanden från en applikation.
- Använd Samza för att implementera asynkron beräkning nära realtid.
- Använd strömbehandling för att ge en högre abstraktionsnivå över meddelandesystem.
Publik
- utvecklare
Kursformat
- Delföreläsning, delvis diskussion, övningar och tung praktisk övning
Datameer for Data Analysts
14 timmarApache NiFi for Administrators
21 timmarI denna instruktörsledda, liveutbildning i Sverige (på plats eller på distans) kommer deltagarna att lära sig hur man distribuerar och hanterar Apache NiFi i en levande labbmiljö.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Apachi NiFi.
- Källa, transformera och hantera data från olika, distribuerade datakällor, inklusive databaser och stora datasjöar.
- Automatisera dataflöden.
- Aktivera strömningsanalys.
- Tillämpa olika metoder för dataintag.
- Förvandla Big Data och till affärsinsikter.