Kursplan
Introduktion
Översikt över dataåtkomstmetoder (Hive, databaser, etc.)
Översikt över Sparks egenskaper och arkitektur
Installation och konfiguration av Spark
Förståelse av Dataframes i Spark
Definiering av tabeller och importering av datamängder
Fråga Data Frames med SQL
Genomförandet av agg regeringar, JOINs och kapslade frågor
Ladda upp och komma åt data
Fråga olika typer av data
- JSON, Parquet, etc.
Fråga datalaker med SQL
Felsökning
Sammanfattning och slutsats
Krav
- Erfarenhet av SQL-frågor
- Programmerings erfarenhet i något språk
Målgrupp
- Dataanalyst
- Datascientist
- Dataingenjör
Vittnesmål (5)
De levande exempelen
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maskintolkat
mycket interaktivt...
Richard Langford
Kurs - SMACK Stack for Data Science
Maskintolkat
Tillräckligt praktiskt, utbildaren är kunskapssam
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maskintolkat
Få lära dig Spark Streaming, Databricks och AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maskintolkat
övningsuppgifter
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maskintolkat