Kursplan
Införandet
Scala Programming Fördjupad granskning
- Syntax och struktur
- Flödeskontroll och funktioner
Spark Internals
- Elastiska distribuerade datamängder (RDD)
- Spark-skript för att skapa diagram till kluster
Översikt över Spark Streaming
- Arkitektur för direktuppspelning
- Intervall i streaming
- Feltolerans
Förberedelse av utvecklingsmiljön
- Installera och konfigurera Apache Spark
- Installera och konfigurera Scala IDE
- Installera och konfigurera JDK
Spark Streaming Nybörjare till Avancerad
- Arbeta med nyckel-/värde-RDD:er
- Filtrera RDD:er
- Förbättra Spark-skript med reguljära uttryck
- Dela data i ett kluster
- Arbeta med nätverksdatauppsättningar
- Implementera BFS-algoritmer
- Skapa Spark-drivrutinsskript
- Spårning i realtid med skript
- Skriva kontinuerliga ansökningar
- Strömmande linjär regression
- Använda Spark Machine Learning-biblioteket
Spark och kluster
- Paketera beroenden och Spark-skript med hjälp av SBT-verktyget
- Använda journalsystem för att illustrera kluster
- Optimera genom att partitionera RDD:er
- Använda Spark-loggar
Integrering i Spark Streaming
- Integrera Apache Kafka och arbeta med Kafka-ämnen
- Integrera Apache Fume och arbeta med pull-baserade/push-baserade Flume-konfigurationer
- Skriva en anpassad mottagarklass
- Integrera Cassandra och exponera data som realtidstjänster
I produktion
- Paketera ett program och köra det med Spark-Submit
- Felsökning, justering och felsökning av Spark-jobb och kluster
Sammanfattning och slutsats
Krav
- Programming och erfarenhet av skript
Publik
- Programvaruingenjörer
Vittnesmål (5)
Många praktiska exempel, olika sätt att närma sig samma problem, och ibland inte så uppenbara knep för att förbättra den nuvarande lösningen
Rafał - Nordea
Kurs - Apache Spark MLlib
Machine Translated
Sufficient hands on, trainer is knowledgable
Chris Tan
Kurs - A Practical Introduction to Stream Processing
practice tasks
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Kurs - Big Data Analytics in Health
This is one of the best hands-on with exercises programming courses I have ever taken.