Kursplan

Införandet

Installera och konfigurera Dataiku Data Science Studio (DSS)

  • Systemkrav för Dataiku DSS
  • Konfigurera Apache Hadoop och Apache Spark integrationer
  • Konfigurera Dataiku DSS med webbproxyservrar
  • Migrera från andra plattformar till Dataiku DSS

Översikt över Dataiku DSS-funktioner och arkitektur

  • Kärnobjekt och grafer som är grundläggande för Dataiku DSS
  • Vad är ett recept i Dataiku DSS?
  • Typer av datauppsättningar som stöds av Dataiku DSS

Skapa ett Dataiku DSS-projekt

Definiera datauppsättningar för att ansluta till dataresurser i Dataiku DSS

  • Arbeta med DSS-kontakter och filformat
  • Standard DSS-format jämfört med Hadoop-specifika format
  • Ladda upp filer för ett Dataiku DSS-projekt

Översikt över serverfilsystemet i Dataiku DSS

Skapa och använda hanterade mappar

  • Dataiku DSS-recept för sammanfogningsmapp
  • Lokala kontra icke-lokala hanterade mappar

Skapa en filsystemdatauppsättning med hjälp av hanterat mappinnehåll

  • Utföra rensningar med ett DSS-kodrecept

Arbeta med måttdatauppsättning och intern statistikdatauppsättning

Implementera DSS-nedladdningsreceptet för HTTP-datauppsättning

Flytta SQL datauppsättningar och HDFS-datauppsättningar med DSS

Beställa datauppsättningar i Dataiku DSS

  • Skrivarordning kontra lästidsordning

Utforska och förbereda visuella dataobjekt för ett Dataiku DSS-projekt

Översikt över dataiku-scheman, lagringstyper och betydelser

Utföra datarensnings-, normaliserings- och berikningsskript i Dataiku DSS

Arbeta med Dataiku DSS Charts Interface och typer av visuella aggregeringar

Använda den interaktiva Statistics-funktionen i DSS

  • Univariat analys kontra bivariat analys
  • Att använda DSS-verktyget Principal Component Analysis (PCA)

Översikt över Machine Learning med Dataiku DSS

  • Övervakad ML jämfört med oövervakad ML
  • Referenser för DSS ML-algoritmer och funktionshantering
  • Deep Learning med Dataiku DSS

Översikt över flödet härlett från DSS-datauppsättningar och recept

Transformera befintliga datauppsättningar i DSS med visuella recept

Använda DSS-recept baserade på användardefinierad kod

Optimera kodutforskning och experimentering med DSS-kodanteckningsböcker

Skriva avancerade DSS-visualiseringar och anpassade frontend-funktioner med Webapps

Arbeta med funktionen Dataiku DSS-kodrapporter

Dela dataprojekt Elements och bekanta dig med DSS-instrumentpanelen

Designa och paketera ett Dataiku DSS-projekt som en återanvändbar applikation

Översikt över avancerade metoder i Dataiku DSS

  • Implementera partitionering av optimerade datauppsättningar med DSS
  • Exekvering av specifika DSS-bearbetningsdelar genom beräkningar i Kubernetes containrar

Översikt över Collaboration och versionskontroll i Dataiku DSS

Implementering av automatiseringsscenarier, mätvärden och kontroller för DSS-projekttestning

Distribuera och uppdatera ett projekt med DSS Automation Node och paket

Arbeta med realtids-API:er i Dataiku DSS

  • Ytterligare API:er och Rest-API:er i DSS

Analysera och Forecasting Dataiku DSS Time Series

Säkra ett projekt i Dataiku DSS

  • Hantera projektbehörigheter och instrumentpanelsauktoriseringar
  • Implementera avancerade säkerhetsalternativ

Integrera Dataiku DSS med molnet

Felsökning

Sammanfattning och slutsats

Krav

  • Erfarenhet av programmeringsspråken Python, SQL och R
  • Grundläggande kunskap om databehandling med Apache Hadoop och Spark
  • Förståelse av maskininlärningskoncept och datamodeller
  • Bakgrund i statistiska analyser och datavetenskapliga koncept
  • Erfarenhet av att visualisera och kommunicera data

Publik

  • Ingenjörer
  • Dataforskare
  • Dataanalytiker
 21 timmar

Antal deltagare



Price per participant

Relaterade Kurser

Relaterade Kategorier