Kursplan
Introduktion
Översikt över dataåtkomstmetoder (Hive, databaser, etc.)
Översikt över Sparks egenskaper och arkitektur
Installation och konfiguration av Spark
Förståelse av Dataframes i Spark
Definiering av tabeller och importering av datamängder
Fråga Data Frames med SQL
Genomförandet av agg regeringar, JOINs och kapslade frågor
Ladda upp och komma åt data
Fråga olika typer av data
- JSON, Parquet, etc.
Fråga datalaker med SQL
Felsökning
Sammanfattning och slutsats
Krav
- Erfarenhet av SQL-frågor
- Programmerings erfarenhet i något språk
Målgrupp
- Dataanalyst
- Datascientist
- Dataingenjör
Vittnesmål (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Kurs - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Get to learn spark streaming , databricks and aws redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
practice tasks
