Kursplan
Introduktion
Översikt över dataåtkomstmetoder (Hive, databaser, etc.)
Översikt över Sparks egenskaper och arkitektur
Installation och konfiguration av Spark
Förståelse av Dataframes i Spark
Definiering av tabeller och importering av datamängder
Fråga Data Frames med SQL
Genomförandet av agg regeringar, JOINs och kapslade frågor
Ladda upp och komma åt data
Fråga olika typer av data
- JSON, Parquet, etc.
Fråga datalaker med SQL
Felsökning
Sammanfattning och slutsats
Krav
- Erfarenhet av SQL-frågor
- Programmerings erfarenhet i något språk
Målgrupp
- Dataanalyst
- Datascientist
- Dataingenjör
Vittnesmål (3)
Jag tyckte att det var praktiskt. Älskade att tillämpa den teoretiska kunskapen med praktiska exempel.
Aurelia-Adriana - Allianz Services Romania
Kurs - Python and Spark for Big Data (PySpark)
Maskintolkat
Det faktum att vi kunde ta med oss den mesta av informationen/kursen/presentationerna/övningarna som gjordes, så att vi kan gå igenom dem och eventuellt göra om det vi inte förstod första gången eller förbättra det vi redan har gjort.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskintolkat
mycket interaktivt...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskintolkat