Kursplan
Introduktion
- Översikt över Spark och Hadoop funktioner och arkitektur
- Förstå big data
- Python grundläggande programmering
Komma igång
- Konfigurera Python, Spark och Hadoop
- Förstå datastrukturer i Python
- Förstå PySpark API
- Förstå HDFS och MapReduce
Integrera Spark och Hadoop med Python
- Implementering av Spark RDD i Python
- Bearbetar data med MapReduce
- Skapa distribuerade datauppsättningar i HDFS
Machine Learning med Spark MLlib
Bearbetar Big Data med Spark Streaming
Arbeta med Recommender Systems
Arbeta med Kafka, Sqoop, Kafka och Flume
Apache Mahout med Spark och Hadoop
Felsökning
Sammanfattning och nästa steg
Krav
- Erfarenhet av Spark och Hadoop
- Python erfarenhet av programmering
Publik
- Dataforskare
- Utvecklare
Vittnesmål (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
The live examples