Kursplan
Introduktion till DataStage
- Översikt över ETL-processen
- Förståelse av DataStage-arkitekturen
- Nyckelkomponenter i DataStage
DataStage-administration
- Installation och konfiguration
- Användar- och säkerhetsadministration
- Projektuppsättning och miljöhantering
- Jobbschemaläggning och -hantering
- Säkerhetskopierings- och återställningsrutiner
Datatekniker för extrahering
- Anslutning till olika datakällor
- Extraktion av data från databaser, platt filer och externa källor
- Bästa praxis för datatekniker för extrahering
Datatransformation med DataStage
- Förståelse av DataStage-designer
- Arbete med olika stagetyper
- Implementering av affärslogik i transformationer
- Avancerade datatransformations tekniker
Datainläsning och integration
- Inläsning av data till målsystem
- Säkerställande av datakvalitet och -integritet
- Felhantering och loggning
Prestandatuning och optimering
- Bästa praxis för prestandatuning
- Resurshantering
- Jobbsekvensering och parallellitet
Avancerade ämnen
- Arbete med DataStage-director
- Felsökning och felsökning
Sammanfattning och nästa steg
Krav
- Grundläggande förståelse av databaskoncept
- Bekantskap med SQL och datawarehouse-principer
Målgrupp
- IT-professionella
- Databasadministratörer
- Utvecklare
Vittnesmål (5)
De levande exempelen
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskintolkat
mycket interaktivt...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskintolkat
Tillräckligt praktiskt, utbildaren är kunskapssam
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maskintolkat
Få lära dig Spark Streaming, Databricks och AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maskintolkat
övningsuppgifter
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maskintolkat