Kursplan
Införandet
Installera och konfigurera Dataiku Data Science Studio (DSS)
- Systemkrav för Dataiku DSS
- Konfigurera Apache Hadoop och Apache Spark integrationer
- Konfigurera Dataiku DSS med webbproxyservrar
- Migrera från andra plattformar till Dataiku DSS
Översikt över Dataiku DSS-funktioner och arkitektur
- Kärnobjekt och grafer som är grundläggande för Dataiku DSS
- Vad är ett recept i Dataiku DSS?
- Typer av datauppsättningar som stöds av Dataiku DSS
Skapa ett Dataiku DSS-projekt
Definiera datauppsättningar för att ansluta till dataresurser i Dataiku DSS
- Arbeta med DSS-kontakter och filformat
- Standard DSS-format jämfört med Hadoop-specifika format
- Ladda upp filer för ett Dataiku DSS-projekt
Översikt över serverfilsystemet i Dataiku DSS
Skapa och använda hanterade mappar
- Dataiku DSS-recept för sammanfogningsmapp
- Lokala kontra icke-lokala hanterade mappar
Skapa en filsystemdatauppsättning med hjälp av hanterat mappinnehåll
- Utföra rensningar med ett DSS-kodrecept
Arbeta med måttdatauppsättning och intern statistikdatauppsättning
Implementera DSS-nedladdningsreceptet för HTTP-datauppsättning
Flytta SQL datauppsättningar och HDFS-datauppsättningar med DSS
Beställa datauppsättningar i Dataiku DSS
- Skrivarordning kontra lästidsordning
Utforska och förbereda visuella dataobjekt för ett Dataiku DSS-projekt
Översikt över dataiku-scheman, lagringstyper och betydelser
Utföra datarensnings-, normaliserings- och berikningsskript i Dataiku DSS
Arbeta med Dataiku DSS Charts Interface och typer av visuella aggregeringar
Använda den interaktiva Statistics-funktionen i DSS
- Univariat analys kontra bivariat analys
- Att använda DSS-verktyget Principal Component Analysis (PCA)
Översikt över Machine Learning med Dataiku DSS
- Övervakad ML jämfört med oövervakad ML
- Referenser för DSS ML-algoritmer och funktionshantering
- Deep Learning med Dataiku DSS
Översikt över flödet härlett från DSS-datauppsättningar och recept
Transformera befintliga datauppsättningar i DSS med visuella recept
Använda DSS-recept baserade på användardefinierad kod
Optimera kodutforskning och experimentering med DSS-kodanteckningsböcker
Skriva avancerade DSS-visualiseringar och anpassade frontend-funktioner med Webapps
Arbeta med funktionen Dataiku DSS-kodrapporter
Dela dataprojekt Elements och bekanta dig med DSS-instrumentpanelen
Designa och paketera ett Dataiku DSS-projekt som en återanvändbar applikation
Översikt över avancerade metoder i Dataiku DSS
- Implementera partitionering av optimerade datauppsättningar med DSS
- Exekvering av specifika DSS-bearbetningsdelar genom beräkningar i Kubernetes containrar
Översikt över Collaboration och versionskontroll i Dataiku DSS
Implementering av automatiseringsscenarier, mätvärden och kontroller för DSS-projekttestning
Distribuera och uppdatera ett projekt med DSS Automation Node och paket
Arbeta med realtids-API:er i Dataiku DSS
- Ytterligare API:er och Rest-API:er i DSS
Analysera och Forecasting Dataiku DSS Time Series
Säkra ett projekt i Dataiku DSS
- Hantera projektbehörigheter och instrumentpanelsauktoriseringar
- Implementera avancerade säkerhetsalternativ
Integrera Dataiku DSS med molnet
Felsökning
Sammanfattning och slutsats
Krav
- Erfarenhet av programmeringsspråken Python, SQL och R
- Grundläggande kunskap om databehandling med Apache Hadoop och Spark
- Förståelse av maskininlärningskoncept och datamodeller
- Bakgrund i statistiska analyser och datavetenskapliga koncept
- Erfarenhet av att visualisera och kommunicera data
Publik
- Ingenjörer
- Dataforskare
- Dataanalytiker