Kursplan
Avsnitt 1: Datahantering i HDFS
- Flera dataformat (JSON / Avro / Parquet)
- Komprimeringsmetoder
- Data maskering
- Laborationer : Analys av olika dataformat; aktivering av kompression
Avsnitt 2: Avancerad Pig
- Användardefinierade funktioner
- Introduktion till Pig-bibliotek (ElephantBird / Data-Fu)
- Läsa in komplexa strukturerade data med Pig
- Pig-tuning
- Laborationer : avancerad Pig-skriptning, tolkning av komplexa datatyper
Avsnitt 3: Avancerad Hive
- Användardefinierade funktioner
- Komprimerade tabeller
- Hive-prestandatuning
- Laborationer : skapa komprimerade tabeller, utvärdera tabelformater och konfiguration
Avsnitt 4: Avancerad HBase
- Avancerat schemamodellering
- Komprimering
- Massedatainsättning
- Jämförelse av breda- och långatabeller
- HBase och Pig
- HBase och Hive
- HBase-prestandatuning
- Laborationer : tuning HBase; åtkomst till HBase-data från Pig & Hive; Användning av Phoenix för datamodellering
Krav
- komfortabel med Java-programmeringsspråket (flesta programmeringsövningar är på java)
- komfortabel i Linux-miljö (ska kunna navigera i Linux-kommandoraden, redigera filer med hjälp av vi / nano)
- praktisk kunskap om Hadoop.
Labbmiljö
Inga installationer: Det finns ingen behov att installera Hadoop-programvara på studerandes datorer! En fungerande Hadoop-kluster kommer att tillhandahållas för studerande.
Studerande behöver följande
Vittnesmål (5)
De levande exempelen
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskintolkat
Under övningarna förklarade James varje steg i mer detalj var som helst jag fastnade. Jag var helt ny på NIFI. Han förklarade det verkliga syftet med NIFI, till och med grundläggande begrepp som open source. Han gick igenom varje koncept inom Nifi, från nybeginjarnivå till utvecklarnivå.
Firdous Hashim Ali - MOD A BLOCK
Kurs - Apache NiFi for Administrators
Maskintolkat
Att jag hade det från början.
Peter Scales - CACI Ltd
Kurs - Apache NiFi for Developers
Maskintolkat
praktiska saker att göra, samtidigt som teori också presenterades väl av Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurs - Hadoop Administration on MapR
Maskintolkat
Jag tyckte mycket om den virtuella datorn. Läraren var mycket kunskapssam om ämnet samt andra ämnen, han var väldigt trevlig och vänlig. Jag tyckte om lokalen i Dubai.
Safar Alqahtani - Elm Information Security
Kurs - Big Data Analytics in Health
Maskintolkat