Hem
Big Data Training
Hadoop Training

Hadoop for Developers and Administrators Träningskurs

(1 Vittnesmål)

Hadoop är den mest populära Big Data-bearbetningsramen .

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Kursplan

Modul 1. Introduktion till Hadoop

Hadoop Distributed File System (HDFS)
Läsvägen och Skrivvägen
Hantera filsystemmetadata
Namnnoden och datanoden
Namenode hög tillgänglighet
Namenode Federation
Kommandoradsverktygen
Förstå REST Support

Modul 2. Introduktion till MapReduce

Analysera data med Hadoop
Kartlägga och minska mönster
Java MapReduce
Skala ut
Data flöde
Utveckla Combiner-funktioner
Köra ett distribuerat MapReduce-jobb

Modul 3. Planera ett Hadoop kluster

Välja en distribution och version av Hadoop
Versioner och funktioner
Val av hårdvara
Val av befälhavare och arbetare
Klusterstorlek
Val och förberedelse av operativsystem
Implementeringslayout
Ställa in användare, grupper och privilegier
Diskkonfiguration
Nätverksdesign

Modul 4. Installation och konfiguration

Installerar Hadoop
Konfiguration: En översikt
Konfigurationsfilerna Hadoop XML
Miljövariabler och skalskript
Loggningskonfiguration
Hantera HDFS
Optimering och inställning
Formatera Namenode
Skapa en /tmp-katalog
Tänker Namenode hög tillgänglighet
Stängselalternativen
Automatisk failover-konfiguration
Formatera och Bootstrap namnnoderna
Namenode Federation

Modul 5. Förstå Hadoop I/O

Dataintegritet i HDFS
Förstå codecs
Kompression och ingångsdelningar
Använda komprimering i MapReduce
Serialiseringsmekanismen
Filbaserade datastrukturer
SequenceFile-formatet
Andra filformat och kolumnorienterade format

Modul 6. Utveckla en MapReduce-applikation

Configuration API
Ställa in utvecklingsmiljön
Hantera konfiguration
GenericOptionsParser, Tool och ToolRunner
Att skriva ett enhetstest med MRUnit
Kartläggaren och reduceraren
Körs lokalt på testdata
Testa drivrutinen
Kör på ett kluster
Packa och lansera ett jobb
Webbgränssnittet för MapReduce
Trimma ett jobb

Modul 7. Identitet, autentisering och auktorisering

Hantera identitet
Kerberos och Hadoop
Förstå auktorisation

Modul 8. Resurs Management

Vad är resurs Management?
HDFS-kvoter
MapReduce Schedulers
Anatomi av en GARN-applikationskörning
Resursförfrågningar
Applikationslivslängd
GARN Jämfört med MapReduce 1
Schemaläggning i GARN
Schemaläggaralternativ
Capacity Scheduler Configuration
Fair Scheduler Configuration
Fördröjning av schemaläggning
Dominant resursrättvisa

Modul 9. MapReduce typer och format

MapReduce Types
Standardjobbet MapReduce
Definiera indataformat
Hantera indatadelningar och poster
Textinmatning och binär inmatning
Hantera flera ingångar
Database Ingång (och utgång)
Utdataformat
Textutdata och binär utdata
Hantera flera utgångar
Utgången Database

Modul 10. Använda MapReduce-funktioner

Använda räknare
Läser inbyggda räknare
Användardefinierade Java räknare
Förstå sortering
Använda den distribuerade cachen

Modul 11. Klusterunderhåll och felsökning

Hantera Hadoop processer
Starta och stoppa processer med Init-skript
Starta och stoppa processer manuellt
HDFS Underhållsuppgifter
Lägga till en Datanode
Avveckling av en Datanode
Kontrollerar filsystemets integritet med fsck
Balansering av HDFS-blockdata
Hantera en defekt disk
MapReduce Underhållsuppgifter
Att döda ett MapReduce-jobb
Att döda en MapReduce-uppgift
Hantera resursutmattning

Modul 12. Övervakning

Tillgängliga Hadoop mätvärden
SNMP:s roll
Hälsoövervakning
Kontroller på värdnivå
HDFS-kontroller
MapReduce Checks

Modul 13. Säkerhetskopiering och återställning

Säkerhetskopiering av data
Distribuerad kopia (distcp)
Parallell dataintag
Namenode Metadata

21 timmar

Antal deltagare

Online

Klassrum

Select Location

Please select a Venue

Price per participant

Open Training Courses require 5+ participants.

Hadoop for Developers and Administrators Träningskurs - Booking

Full name *

Email *

Phone *

Job Title

Company Name

Address 1 *

Address 2

City *

State / Province

Country *

Postcode *

Start Date

Tax ID

Dates are subject to availability and take place between 09:30 and 16:30.

Payment *

Bank Transfer (Invoice, PO)

Debit / Credit Card

Comments

Allow Publishing Certificate

If you check this box the participants will receive an option to publish their course certificate on the NobleProg Certified Professional Catalogue.

Villkor *

I am an authorised representative of the above named client and I wish to book the above courses or services in accordance with NobleProg Terms and Conditions and Privacy Policy.

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Hadoop for Developers and Administrators Träningskurs - Enquiry

Full name *

Email *

Phone *

Antal deltagare

Company Name

Company Address

How do you want to take the course?

Client Premises

Online

Klassrum

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Hadoop for Developers and Administrators - Consultancy Enquiry

Full name *

Phone *

Email *

Company Name

Consultancy Subject *

Consultancy Goal

Consultancy Duration

Number of Consultants

Passande datum

Who will the consultant work with?

Consultancy Urgency *

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Vittnesmål (1)

The fact that all the data and software was ready to use on an already prepared VM, provided by the trainer in external disks.

vyzVoice

Kurs - Hadoop for Developers and Administrators

Upcoming Courses

Relaterade Kurser

Hortonworks Data Platform (HDP) for Administrators

21 timmar

Denna instruktörsledda, liveutbildning i Sverige (online eller på plats) introducerar Hortonworks Data Platform (HDP) och leder deltagarna genom implementeringen av Spark + Hadoop-lösningen.

I slutet av denna utbildning kommer deltagarna att kunna:

Använd Hortonworks för att tillförlitligt köra Hadoop i stor skala. Förena Hadoops funktioner för säkerhet, styrning och drift med Sparks agila analytiska arbetsflöden. Använd Hortonworks för att undersöka, validera, certifiera och stödja var och en av komponenterna i ett Spark-projekt. Bearbeta olika typer av data, inklusive strukturerad, ostrukturerad, i rörelse och i vila.

LÄS MER...

Apache Ambari: Efficiently Manage Hadoop Clusters

21 timmar

Apache Ambari är en open source-managementplattform för att tillhandahålla, hantera, övervaka och säkra Apache Hadoop kluster.

I denna instruktörsledda liveträning kommer deltagarna att lära sig hanteringsverktygen och praxis som Ambari tillhandahåller för att framgångsrikt hantera Hadoop kluster.

I slutet av denna träning kommer deltagarna att kunna:

Ställ in ett live Big Data kluster med Ambari
Använd Ambaris avancerade funktioner och funktioner i olika användningsfall
Lägg till och ta bort noder sömlöst efter behov
Förbättra ett Hadoop klustrets prestanda genom att ställa in och justera

Publik

DevOps
Systemadministratörer
databasadministratörer
Hadoop testare

Kursformat

Delföreläsning, delvis diskussion, övningar och tung praktisk övning

LÄS MER...

Impala for Business Intelligence

21 timmar

Cloudera Impala är en frågemotor för massiv parallell bearbetning (MPP) SQL med öppen källkod för Apache Hadoop-kluster.

Impala gör det möjligt för användare att skicka frågor med låg latens SQL till data lagrade i Hadoop Distributed File System och Apache Hbase utan att kräva dataförflyttning eller transformation.

Publik

Den här kursen vänder sig till analytiker och datavetare som utför analys av data lagrad i Hadoop via Business Intelligence eller SQL verktyg.

Efter denna kurs kommer delegater att kunna

Extrahera meningsfull information från Hadoop-kluster med Impala. Skriv specifika program för att underlätta Business Intelligence i Impala SQL Dialect. Felsöka Impala.

LÄS MER...

Data Analysis with Hive/HiveQL

7 timmar

Denna kurs behandlar hur man använder Hive SQL språk (AKA: Hive HQL, SQL på Hive , Hive QL) för personer som extraherar data från Hive

LÄS MER...

Hadoop Administration

21 timmar

Kursen ägnas åt IT-specialister som letar efter en lösning för att lagra och bearbeta stora datamängder i distribuerad systemmiljö

Kursmål:

Få kunskap om Hadoop klusteradministration

LÄS MER...

Administrator Training for Apache Hadoop

35 timmar

Publik:

Kursen är avsedd för IT-specialister som letar efter en lösning för att lagra och bearbeta stora datamängder i en distribuerad systemmiljö

Go al:

Djup kunskap om Hadoop klusteradministration.

LÄS MER...

Hadoop Administration on MapR

28 timmar

Publik:

Denna kurs är avsedd att avmystifiera big data / hadoop-teknik och för att visa att det inte är svårt att förstå.

LÄS MER...

Hadoop for Developers (4 days)

28 timmar

Apache Hadoop är den mest populära ramen för behandling av Big Data på kluster av servrar. Denna kurs kommer att introducera en utvecklare för olika komponenter (HDFS, MapReduce, Pig, Hive och HBase) Hadoop ekosystem.

LÄS MER...

Advanced Hadoop for Developers

21 timmar

Apache Hadoop är en av de mest populära ramarna för bearbetning av Big Data på kluster av servrar. Denna kurs omfattar datahantering i HDFS, avancerad gris, Hive och HBase. Dessa avancerade programmeringstekniker kommer att vara fördelaktiga för erfarna Hadoop utvecklare.

Publik : utvecklare

Varaktighet: tre dagar

Format: föreläsningar (50%) och praktiska labb (50%).

LÄS MER...

HBase for Developers

21 timmar

Denna kurs introducerar HBase - en No SQL butik ovanpå Hadoop . Kursen är avsedd för utvecklare som kommer att använda HBase för att utveckla applikationer, och administratörer som kommer att hantera HBase-kluster.

Vi kommer att gå en utvecklare genom HBase-arkitektur och datamodellering och applikationsutveckling på HBase. Det kommer också att diskutera att använda MapReduce med HBase, och några administrationsämnen, relaterade till prestandaoptimering. Kursen är mycket praktisk med massor av labbövningar.

Varaktighet : 3 dagar

Publik : Utvecklare och administratörer

LÄS MER...

Hadoop For Administrators

21 timmar

Apache Hadoop är den mest populära ramen för behandling av Big Data på kluster av servrar. I den här tre (valfritt, fyra) dagars kurs kommer deltagarna att lära sig om affärsfördelarna och använda fall för Hadoop och dess ekosystem, hur man planerar distribution och tillväxt av kluster, hur man installerar, underhåller, övervakar, felsöker och optimerar Hadoop . De kommer också att öva kluster bulk data belastning, bekanta sig med olika Hadoop distributioner och öva på att installera och hantera Hadoop ekosystemverktyg. Kursen avslutas med diskussion om att säkra kluster med Kerberos.

”... Materialen var mycket väl förberedda och täckta noggrant. Laben var mycket hjälpsam och välorganiserad ”
- Andrew Nguyen, Principal Integration DW Engineer, Microsoft Online Advertising

Publik

Hadoop administratörer

Formatera

Föreläsningar och praktiska labb, ungefärligt balans 60% föreläsningar, 40% labb.

LÄS MER...

Hadoop for Developers and Administrators

21 timmar

Hadoop är den mest populära Big Data-bearbetningsramen .

LÄS MER...

Hadoop for Project Managers

14 timmar

I denna instruktörsledda utbildning i Sverige kommer deltagarna att lära sig kärnkomponenterna i ekosystemet Hadoop och hur dessa tekniker kan användas för att lösa storskaliga problem. Genom att lära sig dessa grunder kommer deltagarna att förbättra sin förmåga att kommunicera med utvecklarna och implementerarna av dessa system samt de datavetare och analytiker som många IT-projekt involverar.

Publik

Projektledare som vill implementera Hadoop i sin befintliga utvecklings- eller IT-infrastruktur
Projektledare som behöver kommunicera med tvärfunktionella team som inkluderar big data-ingenjörer, datavetare och affärsanalytiker

LÄS MER...

Samza for Stream Processing

14 timmar

Apache Samza är en öppen källkod, nästan realtid, asynkron beräkningsram för strömbehandling. Den använder Apache Kafka för meddelanden och Apache Hadoop YARN för feltolerans, processorisolering, säkerhet och resurshantering.

Den här instruktörsledda, live-utbildningen introducerar principerna bakom meddelandesystem och distribuerad strömbearbetning, samtidigt som deltagarna går genom skapandet av ett exempel på Samza-baserat projekt och jobbutförande.

I slutet av denna träning kommer deltagarna att kunna:

Använd Samza för att förenkla koden som behövs för att producera och konsumera meddelanden.
Koppla bort hanteringen av meddelanden från en applikation.
Använd Samza för att implementera asynkron beräkning nära realtid.
Använd strömbehandling för att ge en högre abstraktionsnivå över meddelandesystem.

Publik

utvecklare

Kursformat

Delföreläsning, delvis diskussion, övningar och tung praktisk övning

LÄS MER...

Datameer for Data Analysts

14 timmar

Datameer är en affärsinformations- och analysplattform byggd på Hadoop Det gör det möjligt för endusers att få tillgång till, utforska och korrelera storskala, strukturerad, semistrukturerad och ostrukturerad data på ett easytouse-sätt I den här instruktionsledda träningspasset lär deltagarna att använda Datameer för att övervinna Hadops branta inlärningskurva, eftersom de går igenom installationen och analysen av en serie stora datakällor Vid slutet av denna utbildning kommer deltagarna att kunna: Skapa, curate och interaktivt utforska en företagsdatasjö Få tillgång till affärsinformationslager, transaktionsdatabaser och andra analytiska butiker Använd en kalkylarks användargränssnitt för att designa ändringsrutiner för databehandling Få tillgång till förbyggda funktioner för att utforska komplexa datarelationer Använd draganddrop-guider för att visualisera data och skapa instrumentpaneler Använd tabeller, diagram, grafer och kartor för att analysera sökresultat Publik Dataanalyser Kursens format Delföreläsning, diskussion, övningar och tung handson-övning .

LÄS MER...

Hadoop for Developers and Administrators Träningskurs

Kursplan

Modul 1. Introduktion till Hadoop

Modul 2. Introduktion till MapReduce

Modul 3. Planera ett Hadoop kluster

Modul 4. Installation och konfiguration

Modul 5. Förstå Hadoop I/O

Modul 6. Utveckla en MapReduce-applikation

Modul 7. Identitet, autentisering och auktorisering

Modul 8. Resurs Management

Modul 9. MapReduce typer och format

Modul 10. Använda MapReduce-funktioner

Modul 11. Klusterunderhåll och felsökning

Modul 12. Övervakning

Modul 13. Säkerhetskopiering och återställning

Vittnesmål (1)

vyzVoice

Kurs - Hadoop for Developers and Administrators

Upcoming Courses

Hadoop for Developers and Administrators

Hadoop for Developers and Administrators

Hadoop for Developers and Administrators

Hadoop for Developers and Administrators

Hadoop for Developers and Administrators

Hadoop for Developers and Administrators

Hadoop for Developers and Administrators

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites