Kursplan

Greenplum Arkitektur

  • Parallellbehandling och symmetrisk multiprocessor
  • Segmentroller och klusterkonfiguration
  • Skalbarhet och dataöverföring
  • Greenplum Data Warehouse arkitektur

Greenplum Tabellstruktur

  • Distribuerade vs. slumpmässigt tilldelade tabeller
  • Hög vs. append-only tabeller
  • Rad- vs. kolumnbaserade lagringsformat
  • Partitionerade och klustrade tabeller

Datafördelning och Hashning

  • Hashningslogik och fördelningsnycklar
  • Skew-hantering och prestanda påverkan
  • Hash-kartor och radplaceringsstrategier

Index och Prestandaoptimering

  • Klustrade och icke-klustrade index
  • B-träd och bitmappindex användningsfall
  • Indexskanning och lagringsbeteende

Fysisk Database Design

  • Normalisering och logisk modelldesign
  • Användaråtkomststrategier och fördelningsanalys
  • Datademografi och indexbeslut

Denormaliseringstekniker

  • Hämtad data, sammanfattningstabeller och pre-joins
  • Kolumntabeller som vertikal partitionering
  • Datamarts och materialiserade vyer

Avancerad SQL och Frågeutförande

  • Join-strategier och omfördelning
  • OLAP och fönsterfunktioner
  • Tillfälliga tabeller, underfraser och härledda tabeller

EXPLAIN Planer och Frågeoptimering

  • Läsning och tolkning av EXPLAIN-utdata
  • Kostnadsanalys och planoptimering
  • Join-rörelse och segment-lokala operationer

Greenplum Verktyg och Bästpraxis

  • ANALYZE och VACUUM
  • Datainläsning och överföring med Nexus
  • Säkerhet, behörigheter och prestandatips

Sammanfattning och Nästa Steg

Krav

  • En förståelse för relationella databaser och SQL
  • Erfarenhet av datawarehousing eller analytiska system
  • Kännedom om Linux kommando-radsoperationer

Målgrupp

  • Datarkitekter och ingenjörer
  • Database-administratörer och tekniska ledare
  • BI-utvecklare och analytiker som arbetar med Greenplum
 21 timmar

Antal deltagare


Price per participant

Vittnesmål (3)

Upcoming Courses

Relaterade Kategorier