Kursplan

Introduktion till Stratio Platform

  • Översikt över Stratio-arkitektur och kärnmoduler
  • Rollen för Rocket och Intelligence i datalivet
  • Inloggning och navigering i Stratio UI

Arbeta med Rocket-Modulen

  • Datainhämtning och pipeline-skapande
  • Anslutning av datakällor och konfiguration av transformationer
  • Användning av PySpark för förbehandling av uppgifter i Rocket

PySpark Grundläggande för Stratio Användare

  • PySpark datastrukturer och operationer
  • Loopkonstruktioner: användning av for, while, if/else
  • Skrivning av anpassade funktioner med def och tillämpning av dem

Avancerad Användning av Rocket med PySpark

  • Streaming inhämtning och transformationer
  • Användning av loopar och funktioner i batch- och realtidscenarier
  • Bäst praxis för prestanda i PySpark pipelines

Undersökning av Intelligence-Modulen

  • Översikt över datamodellering och analysfunktioner
  • Funktioner för urval, transformation och utforskning
  • Rollen för PySpark i anpassad analys och insikter

Byggande av Avancerade Analysflöden

  • Skapande av användardefinierade funktioner (UDFs) i Intelligence
  • Tillämpning av villkor och loopar för datalogik
  • Användningsområden: segmentering, aggregering och förutsägelse

Distribution och Collaboration

  • Spara, exportera och återanvända arbetsflöden
  • Samarbete med andra teammedlemmar i Stratio
  • Granskning av utgång och integration med nedströmsverktyg

Sammanfattning och Nästa Steg

Krav

  • Erfarenhet av Python-programmering
  • Förståelse för dataanalys eller begrepp inom bearbetning av stora datamängder
  • Grundläggande kunskap om Apache Spark och distribuerad beräkning

Målgrupp

  • Dataingenjörer som arbetar på Stratio-baserade plattformar
  • Analytiker eller utvecklare som använder Rocket och Intelligence-moduler
  • Tekniska team som övergår till PySpark-arbetsflöden inom Stratio
Stratio: Rocket och Intelligence-Moduler med PySpark

Introduktion till Stratio-plattformen

  • Översikt över Stratio-arkitektur och kärnmoduler
  • Rollen för Rocket och Intelligence i datalivscykeln
  • Inloggning och navigering i Stratio-gränssnittet

Arbete med Rocket-modulen

  • Datainhämtning och skapande av pipelines
  • Anslutning av datakällor och konfiguration av transformationer
  • Användning av PySpark för förbehandlingsuppgifter i Rocket

PySpark-grundläggande för Stratio-användare

  • PySpark-datastrukturer och operationer
  • Loops: användning av for, while, och if/else
  • Skrivning av anpassade funktioner med def och tillämpning av dem

Avancerad användning av Rocket med PySpark

  • Strömningsinhämtning och transformationer
  • Användning av loops och funktioner i batch- och realtids-scenarier
  • Bäst praxis för prestanda i PySpark-pipelines

Utforskning av Intelligence-modulen

  • Översikt över funktioner för data modellering och analys
  • Val, transformation och utforskning av funktioner
  • Rollen för PySpark i anpassade analyser och insikter

Skapande av avancerade analytiska arbetsflöden

  • Skapande av användardefinierade funktioner (UDF) i Intelligence
  • Tillämpning av villkor och loops för datalogik
  • Användningsfall: segmentering, aggregation och prediktion

Distribution och Collaboration

  • Sparande, export och återanvändning av arbetsflöden
  • Samarbete med andra teammedlemmar på Stratio
  • Granskning av utgång och integration med nedströmsverktyg

Sammanfattning och nästa steg

Stratio är en datacentrisk plattform som integrerar stora datamängder, AI och styrning till en enda lösning. Dess Rocket och Intelligence-moduler möjliggör snabb datautforskning, transformation och avancerad analys i företagsmiljöer.Denna instruktörsledda, live-träning (online eller på plats) är riktad till dataprofessionella på mellanavancerad nivå som vill använda Rocket och Intelligence-moduler i Stratio effektivt med PySpark, med fokus på loopstrukturer, användardefinierade funktioner och avancerad datalogik.I slutet av denna träning kommer deltagarna att kunna:
  • Navigera och arbeta inom Stratio-plattformen med Rocket och Intelligence-moduler.
  • Använda PySpark i samband med datainhämtning, transformation och analys.
  • Använda loops och villkorslogik för att kontrollera dataarbetsflöden och funktioner för ingenjörsarbete.
  • Skapa och hantera användardefinierade funktioner (UDF) för återanvändbara databearbetningar i PySpark.

Format för kursen

  • Interaktiv föreläsning och diskussion.
  • Många övningar och praktik.
  • Hands-on-implementering i en live-lab-miljö.

Alternativ för kursanpassning

  • För att begära en anpassad träning för denna kurs, kontakta oss för att ordna.
  • Erfarenhet av Python-programmering
  • Förståelse för dataanalys eller begrepp inom bearbetning av stora datamängder
  • Grundläggande kunskap om Apache Spark och distribuerad beräkning

Målgrupp

  • Dataingenjörer som arbetar på Stratio-baserade plattformar
  • Analytiker eller utvecklare som använder Rocket och Intelligence-moduler
  • Tekniska team som övergår till PySpark-arbetsflöden inom Stratio
 14 timmar

Antal deltagare


Price per participant

Vittnesmål (5)

Upcoming Courses

Relaterade Kategorier