Kursplan

Introduktion till Stratio Platform

  • Översikt över Stratio-arkitektur och kärnmoduler
  • Rollen för Rocket och Intelligence i datalivet
  • Inloggning och navigering i Stratio UI

Arbeta med Rocket-Modulen

  • Datainhämtning och pipeline-skapande
  • Anslutning av datakällor och konfiguration av transformationer
  • Användning av PySpark för förbehandling av uppgifter i Rocket

PySpark Grundläggande för Stratio Användare

  • PySpark datastrukturer och operationer
  • Loopkonstruktioner: användning av for, while, if/else
  • Skrivning av anpassade funktioner med def och tillämpning av dem

Avancerad Användning av Rocket med PySpark

  • Streaming inhämtning och transformationer
  • Användning av loopar och funktioner i batch- och realtidscenarier
  • Bäst praxis för prestanda i PySpark pipelines

Undersökning av Intelligence-Modulen

  • Översikt över datamodellering och analysfunktioner
  • Funktioner för urval, transformation och utforskning
  • Rollen för PySpark i anpassad analys och insikter

Byggande av Avancerade Analysflöden

  • Skapande av användardefinierade funktioner (UDFs) i Intelligence
  • Tillämpning av villkor och loopar för datalogik
  • Användningsområden: segmentering, aggregering och förutsägelse

Distribution och Collaboration

  • Spara, exportera och återanvända arbetsflöden
  • Samarbete med andra teammedlemmar i Stratio
  • Granskning av utgång och integration med nedströmsverktyg

Sammanfattning och Nästa Steg

Krav

  • Erfarenhet av Python-programmering
  • Förståelse för dataanalys eller koncept för bearbetning av stora mängder data
  • Grundläggande kunskaper om Apache Spark och distribuerad beräkning

Målgrupp

  • Dataingenjörer som arbetar med Stratio-baserade plattformar
  • Analytiker eller utvecklare som använder Rocket och Intelligence-moduler
  • Tekniska team som övergår till PySpark-arbetsflöden inom Stratio
 14 timmar

Antal deltagare


Pris per deltagare

Vittnesmål (4)

Kommande Kurser

Relaterade Kategorier