Kursplan
Introduktion till Stratio Platform
- Översikt över Stratio-arkitektur och kärnmoduler
- Rollen för Rocket och Intelligence i datalivet
- Inloggning och navigering i Stratio UI
Arbeta med Rocket-Modulen
- Datainhämtning och pipeline-skapande
- Anslutning av datakällor och konfiguration av transformationer
- Användning av PySpark för förbehandling av uppgifter i Rocket
PySpark Grundläggande för Stratio Användare
- PySpark datastrukturer och operationer
- Loopkonstruktioner: användning av for, while, if/else
- Skrivning av anpassade funktioner med def och tillämpning av dem
Avancerad Användning av Rocket med PySpark
- Streaming inhämtning och transformationer
- Användning av loopar och funktioner i batch- och realtidscenarier
- Bäst praxis för prestanda i PySpark pipelines
Undersökning av Intelligence-Modulen
- Översikt över datamodellering och analysfunktioner
- Funktioner för urval, transformation och utforskning
- Rollen för PySpark i anpassad analys och insikter
Byggande av Avancerade Analysflöden
- Skapande av användardefinierade funktioner (UDFs) i Intelligence
- Tillämpning av villkor och loopar för datalogik
- Användningsområden: segmentering, aggregering och förutsägelse
Distribution och Collaboration
- Spara, exportera och återanvända arbetsflöden
- Samarbete med andra teammedlemmar i Stratio
- Granskning av utgång och integration med nedströmsverktyg
Sammanfattning och Nästa Steg
Krav
- Erfarenhet av Python-programmering
- Förståelse för dataanalys eller begrepp inom bearbetning av stora datamängder
- Grundläggande kunskap om Apache Spark och distribuerad beräkning
Målgrupp
- Dataingenjörer som arbetar på Stratio-baserade plattformar
- Analytiker eller utvecklare som använder Rocket och Intelligence-moduler
- Tekniska team som övergår till PySpark-arbetsflöden inom Stratio
Introduktion till Stratio-plattformen
- Översikt över Stratio-arkitektur och kärnmoduler
- Rollen för Rocket och Intelligence i datalivscykeln
- Inloggning och navigering i Stratio-gränssnittet
Arbete med Rocket-modulen
- Datainhämtning och skapande av pipelines
- Anslutning av datakällor och konfiguration av transformationer
- Användning av PySpark för förbehandlingsuppgifter i Rocket
PySpark-grundläggande för Stratio-användare
- PySpark-datastrukturer och operationer
- Loops: användning av for, while, och if/else
- Skrivning av anpassade funktioner med def och tillämpning av dem
Avancerad användning av Rocket med PySpark
- Strömningsinhämtning och transformationer
- Användning av loops och funktioner i batch- och realtids-scenarier
- Bäst praxis för prestanda i PySpark-pipelines
Utforskning av Intelligence-modulen
- Översikt över funktioner för data modellering och analys
- Val, transformation och utforskning av funktioner
- Rollen för PySpark i anpassade analyser och insikter
Skapande av avancerade analytiska arbetsflöden
- Skapande av användardefinierade funktioner (UDF) i Intelligence
- Tillämpning av villkor och loops för datalogik
- Användningsfall: segmentering, aggregation och prediktion
Distribution och Collaboration
- Sparande, export och återanvändning av arbetsflöden
- Samarbete med andra teammedlemmar på Stratio
- Granskning av utgång och integration med nedströmsverktyg
Sammanfattning och nästa steg
Stratio är en datacentrisk plattform som integrerar stora datamängder, AI och styrning till en enda lösning. Dess Rocket och Intelligence-moduler möjliggör snabb datautforskning, transformation och avancerad analys i företagsmiljöer.Denna instruktörsledda, live-träning (online eller på plats) är riktad till dataprofessionella på mellanavancerad nivå som vill använda Rocket och Intelligence-moduler i Stratio effektivt med PySpark, med fokus på loopstrukturer, användardefinierade funktioner och avancerad datalogik.I slutet av denna träning kommer deltagarna att kunna:- Navigera och arbeta inom Stratio-plattformen med Rocket och Intelligence-moduler.
- Använda PySpark i samband med datainhämtning, transformation och analys.
- Använda loops och villkorslogik för att kontrollera dataarbetsflöden och funktioner för ingenjörsarbete.
- Skapa och hantera användardefinierade funktioner (UDF) för återanvändbara databearbetningar i PySpark.
Format för kursen
- Interaktiv föreläsning och diskussion.
- Många övningar och praktik.
- Hands-on-implementering i en live-lab-miljö.
Alternativ för kursanpassning
- För att begära en anpassad träning för denna kurs, kontakta oss för att ordna.
- Erfarenhet av Python-programmering
- Förståelse för dataanalys eller begrepp inom bearbetning av stora datamängder
- Grundläggande kunskap om Apache Spark och distribuerad beräkning
Målgrupp
- Dataingenjörer som arbetar på Stratio-baserade plattformar
- Analytiker eller utvecklare som använder Rocket och Intelligence-moduler
- Tekniska team som övergår till PySpark-arbetsflöden inom Stratio
Vittnesmål (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Kurs - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Kurs - QGIS for Geographic Information System
Jag gillade Pablos stil, det faktum att han täckte många ämnen från rapportdesign, anpassning med html till implementering av enkla ML-algoritmer. Good balans teoretisk information / övningar. Pablo täckte verkligen alla ämnen jag var intresserad av och gav omfattande svar på mina frågor.
Cristian Tudose - SC Automobile Dacia SA
Kurs - Advanced Data Analysis with TIBCO Spotfire
Machine Translated
Actual application of spotfire and all basic functions.
Michael Capili - STMicroelectronics, Inc.
Kurs - Introduction to Spotfire
The thing I liked the most about the training was the organization and the location