Kursplan

Introduktion

Installera och Konfigurera Dataiku Data Science Studio (DSS)

  • Systemkrav för Dataiku DSS
  • Konfigurering av Apache Hadoop- och Apache Spark-integrationer
  • Konfigurera Dataiku DSS med webbproxies
  • Migrering från andra plattformar till Dataiku DSS

Översikt över Dataiku DSS Funktioner och Arkitektur

  • Grundläggande objekt och grafer i Dataiku DSS
  • Vad är en recept i Dataiku DSS?
  • Typer av uppsättningar som stöds av Dataiku DSS

Skapa ett Dataiku DSS Projekt

Definiera uppsättningar för att ansluta till dataresurser i Dataiku DSS

  • Arbeta med DSS-anslutningar och filformat
  • Standard DSS-format v.s. Hadoop-specifika format
  • Ladda upp filer för ett Dataiku DSS-projekt

Översikt över Serverfilsystemet i Dataiku DSS

Skapa och Använda Hanterade Mappar

  • Dataiku DSS-recept för sammanfogad mapp
  • Lokala v.s. icke-lokala hanterade mappar

Skapa en Filsystemsuppsättning med innehåll från hanterade mappar

  • Utföra rening med ett DSS-kodrecept

Arbeta med Metriska Uppsättningar och Interna Statistikuppsättningar

Implementera DSS Laddningsrecept för HTTP-uppsättningar

Flytta SQL-uppsättningar och HDFS-uppsättningar med DSS

Ordna uppsättningar i Dataiku DSS

  • Skrivordning v.s. läsläsningstid ordning

Utforska och Förbereda Datavisualiseringar för ett Dataiku DSS Projekt

Översikt över Dataiku Schema, Lagringstyper och Betydelser

Utföra Rengöring, Normalisering och Berikning av Skript i Dataiku DSS

Arbeta med Dataiku DSS Diagramgränssnitt och Typer av Visuella Aggregeringar

Använda den Interaktiva Statistikfunktionen i DSS

  • Univariat analys v.s. bivariat analys
  • Använda verktyget för Principal Component Analysis (PCA) i DSS

Översikt över Maskinlärning med Dataiku DSS

  • Övervakad ML v.s. oövervakad ML
  • Referenser för DSS ML-algoritmer och hantering av funktioner
  • Djupinlärning med Dataiku DSS

Översikt över Flödet som härleds från DSS-uppsättningar och recept

Transformera befintliga uppsättningar i DSS med visuella recept

Använda DSS-recept baserade på användardefinierad kod

Optimera kodutforskning och experimentering med DSS-kodanteckningar

Skriva avancerade DSS-visualiseringar och anpassade frontend-funktioner med webapps

Arbeta med Dataiku DSS-kodrapportfunktion

Dela projekt-element och bekanta sig med DSS-dashboards

Designa och Förpacka ett Dataiku DSS Projekt som en Återanvändbar Applikation

Översikt över Avancerade Metoder i Dataiku DSS

  • Implementera optimerad uppsättningspartitionering med DSS
  • Kör specifika DSS-bearbetningsdelar via beräkningar i Kubernetes-container

Översikt över Samarbete och Versionshantering i Dataiku DSS

Implementera automatiseringsscenarier, mätningar och kontroller för DSS-projekttestning

Distribuera och Uppdatera ett Projekt med DSS-automatiseringsnod och Paket

Arbeta med Real-Time APIs i Dataiku DSS

  • Ytterligare API:er och Rest API:er i DSS

Analysera och Prognostisera Dataiku DSS Tidssekvenser

Säkra ett Projekt i Dataiku DSS

  • Hantera projektbehörigheter och dashboardauktorisationer
  • Implementera avancerade säkerhetsalternativ

Integrera Dataiku DSS med Moln

Felsökning

Sammanfattning och Slutsats

Krav

  • Erfarenhet av Python, SQL och R-programmeringsspråk
  • Grundläggande kunskap om databehandling med Apache Hadoop och Spark
  • Förståelse för maskininlärningskoncept och datamodeller
  • Bakgrund i statistiska analyser och datavetenskapliga koncept
  • Erfarenhet av att visualisera och kommunicera data

Målgrupp

  • Ingenjörer
  • Datavetare
  • Dataanalytiker
 21 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier