Kursplan
Introduktion
Installera och Konfigurera Dataiku Data Science Studio (DSS)
- Systemkrav för Dataiku DSS
- Konfigurering av Apache Hadoop- och Apache Spark-integrationer
- Konfigurera Dataiku DSS med webbproxies
- Migrering från andra plattformar till Dataiku DSS
Översikt över Dataiku DSS Funktioner och Arkitektur
- Grundläggande objekt och grafer i Dataiku DSS
- Vad är en recept i Dataiku DSS?
- Typer av uppsättningar som stöds av Dataiku DSS
Skapa ett Dataiku DSS Projekt
Definiera uppsättningar för att ansluta till dataresurser i Dataiku DSS
- Arbeta med DSS-anslutningar och filformat
- Standard DSS-format v.s. Hadoop-specifika format
- Ladda upp filer för ett Dataiku DSS-projekt
Översikt över Serverfilsystemet i Dataiku DSS
Skapa och Använda Hanterade Mappar
- Dataiku DSS-recept för sammanfogad mapp
- Lokala v.s. icke-lokala hanterade mappar
Skapa en Filsystemsuppsättning med innehåll från hanterade mappar
- Utföra rening med ett DSS-kodrecept
Arbeta med Metriska Uppsättningar och Interna Statistikuppsättningar
Implementera DSS Laddningsrecept för HTTP-uppsättningar
Flytta SQL-uppsättningar och HDFS-uppsättningar med DSS
Ordna uppsättningar i Dataiku DSS
- Skrivordning v.s. läsläsningstid ordning
Utforska och Förbereda Datavisualiseringar för ett Dataiku DSS Projekt
Översikt över Dataiku Schema, Lagringstyper och Betydelser
Utföra Rengöring, Normalisering och Berikning av Skript i Dataiku DSS
Arbeta med Dataiku DSS Diagramgränssnitt och Typer av Visuella Aggregeringar
Använda den Interaktiva Statistikfunktionen i DSS
- Univariat analys v.s. bivariat analys
- Använda verktyget för Principal Component Analysis (PCA) i DSS
Översikt över Maskinlärning med Dataiku DSS
- Övervakad ML v.s. oövervakad ML
- Referenser för DSS ML-algoritmer och hantering av funktioner
- Djupinlärning med Dataiku DSS
Översikt över Flödet som härleds från DSS-uppsättningar och recept
Transformera befintliga uppsättningar i DSS med visuella recept
Använda DSS-recept baserade på användardefinierad kod
Optimera kodutforskning och experimentering med DSS-kodanteckningar
Skriva avancerade DSS-visualiseringar och anpassade frontend-funktioner med webapps
Arbeta med Dataiku DSS-kodrapportfunktion
Dela projekt-element och bekanta sig med DSS-dashboards
Designa och Förpacka ett Dataiku DSS Projekt som en Återanvändbar Applikation
Översikt över Avancerade Metoder i Dataiku DSS
- Implementera optimerad uppsättningspartitionering med DSS
- Kör specifika DSS-bearbetningsdelar via beräkningar i Kubernetes-container
Översikt över Samarbete och Versionshantering i Dataiku DSS
Implementera automatiseringsscenarier, mätningar och kontroller för DSS-projekttestning
Distribuera och Uppdatera ett Projekt med DSS-automatiseringsnod och Paket
Arbeta med Real-Time APIs i Dataiku DSS
- Ytterligare API:er och Rest API:er i DSS
Analysera och Prognostisera Dataiku DSS Tidssekvenser
Säkra ett Projekt i Dataiku DSS
- Hantera projektbehörigheter och dashboardauktorisationer
- Implementera avancerade säkerhetsalternativ
Integrera Dataiku DSS med Moln
Felsökning
Sammanfattning och Slutsats
Krav
- Erfarenhet av Python, SQL och R-programmeringsspråk
- Grundläggande kunskap om databehandling med Apache Hadoop och Spark
- Förståelse för maskininlärningskoncept och datamodeller
- Bakgrund i statistiska analyser och datavetenskapliga koncept
- Erfarenhet av att visualisera och kommunicera data
Målgrupp
- Ingenjörer
- Datavetare
- Dataanalytiker