Kursplan
Avsnitt 1: Data Management i HDFS
- Olika dataformat (JSON / Avro / Parquet)
- Komprimeringsscheman
- Maskering av data
- Labb : Analysera olika dataformat; Aktivera komprimering
Avsnitt 2: Avancerad gris
- Användardefinierade funktioner
- Introduktion till grisbibliotek (ElephantBird / Data-Fu)
- Ladda komplexa strukturerade data med Pig
- gris stämning
- Labs : avancerad pig scripting, parsning av komplexa datatyper
Avsnitt 3 : Avancerat Hive
- Användardefinierade funktioner
- Komprimerade tabeller
- Hive Inställning av prestanda
- Labs : skapa komprimerade tabeller, utvärdera tabellformat och konfiguration
Avsnitt 4: Avancerad HBase
- Avancerad schemamodellering
- Komprimering
- Massinmatning av data
- Jämförelse mellan bredbord och högt bord
- HBase och gris
- HBase och Hive
- HBase prestanda trimning
- Labs : tuning HBase; åtkomst till HBase-data från Pig & Hive; Använda Phoenix för datamodellering
Krav
- Bekväm med Java programmeringsspråk (de flesta programmeringsövningar är i Java)
- bekväm i Linux miljö (kunna navigera Linux kommandoraden, redigera filer med vi / nano)
- En praktisk kunskap om Hadoop.
Labbmiljö
Noll installation: Det finns inget behov av att installera hadoop-programvara på elevernas datorer! Ett fungerande hadoop-kluster kommer att tillhandahållas för studenter.
Studenter kommer att behöva följande
- en SSH-klient (Linux och Mac har redan ssh-klienter, för Windows rekommenderas Putty )
- En webbläsare för att komma åt klustret. Vi rekommenderar webbläsaren Firefox
Vittnesmål (5)
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurs - Impala for Business Intelligence
practical things of doing, also theory was served good by Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurs - Hadoop Administration on MapR
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Kurs - Big Data Analytics in Health
Liked very much the interactive way of learning.
Luigi Loiacono
Kurs - Data Analysis with Hive/HiveQL
I mostly liked the trainer giving real live Examples.