Kursplan
Introduktion till Apache Iceberg
- Översikt över Apache Iceberg
- Översikt över grundläggande begrepp
Djuplodande analys av Icebergs arkitektur
- Djuplodande analys av Icebergs tabellformat
- Detaljerad översikt över arkitekturen, inklusive metadata och filupplägg
- Internstruktur för schemauppdatering och partitionering
Avancerad installation och konfiguration
- Konfigurera Iceberg för optimal prestanda i olika miljöer
- Integration med olika databearbetningsmotorer
- Avancerad installation: säkerhet, kryptering och åtkomstkontroller
- Installation av Iceberg i en distribuerad miljö
Avancerade operationer och underhåll
- Hantering av stora Iceberg-tabeller
- Implementering och hantering av komplexa schemamodifikationer
- Hantering av partitionering och dolda partitioner
- Avancerade CRUD-operationer med schemamodifikationer och partitionering
Tekniker för förbättring av förfrågningseffektivitet
- Tekniker för att minska förfrågningslatens
- Partitionering och filutval
- Cache och optimering av metadata
- Implementering och testning av tekniker för förfrågningseffektivitet
Prestandainställningar för stora datamängder
- Optimera prestanda för stora datamängder
- Använda Icebergs inbyggda funktioner för prestandainställningar
- Fallstudier om prestandainställningar i verkliga scenarier
- Inställningar för prestanda i stora datamängder
Avancerad datamigration och integration
- Migration av komplexa datastrukturer från andra system
- Integration av Iceberg med realtidsdataströmmar
- Migration av komplexa datamängder och integration av realtidsdataströmmar
Tillförlitlighet och konsistens
- Säkerställande av datakonsistens och integritet i distribuerade miljöer
- Implementering och hantering av transaktionsgarantier
- Hantering av fel och återhämtningsmekanismer
- Implementering av funktioner för tillförlitlighet och konsistens
Avancerade funktioner och anpassning
- Anpassade katalogimplementeringar
- Utöka Iceberg med anpassade funktioner
- Implementering av anpassade kataloger och utökning av Iceberg-funktioner
Datastyrelse och efterlevnad
- Implementering av datastyrningsprinciper
- Efterlevnad av dataregler
- Hantering av revisionsspår och datalinje
- Implementering av funktioner för datastyrelse och efterlevnad
Sammanfattning och nästa steg
Krav
- Bekantskap med grundläggande begrepp, grundläggande operationer och Iceberg-tabellhantering
Målgrupp
- Datatekniker
- Dataarkitekter
- Dataanalytiker
- Programutvecklare
Vittnesmål (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
practice tasks