Tack för att du skickade din fråga! En av våra teammedlemmar kontaktar dig snart.
Tack för att du skickade din bokning! En av våra teammedlemmar kontaktar dig snart.
Kursplan
Införandet:
- Apache Spark i Hadoop Ekosystem
- Kort introduktion för python, scala
Grunder (teori):
- Arkitektur
- RDD
- Omvandling och åtgärder
- Skede, uppgift, beroenden
Med hjälp av Databricks miljö förstå grunderna (praktisk workshop):
- Övningar med RDD API
- Grundläggande åtgärds- och omformningsfunktioner
- PairRDD
- Ansluta
- Strategier för cachelagring
- Övningar med DataFrame-API
- GnistaSQL
- DataFrame: välj, filtrera, gruppera, sortera
- UDF (användardefinierad funktion)
- Tittar på DataSet API
- Direktuppspelning
Med hjälp av AWS-miljön förstår du distributionen (praktisk workshop):
- Grunderna i AWS-lim
- Förstå skillnader mellan AWS EMR och AWS Glue
- Exempeljobb i båda miljöerna
- Förstå för- och nackdelar
Extra:
- Introduktion till Apache Airflow orkestrering
Krav
Programmeringskunskaper (helst python, scala)
SQL grunderna
21 timmar
Vittnesmål (3)
Att ha praktiska sessioner/uppdrag
Poornima Chenthamarakshan - Intelligent Medical Objects
Kurs - Apache Spark in the Cloud
Maskintolkat
1. Rätt balans mellan högnivåkoncept och tekniska detaljer. 2. Andras är mycket kunskapsgivare i sin undervisning. 3. Övnings
Steven Wu - Intelligent Medical Objects
Kurs - Apache Spark in the Cloud
Maskintolkat
Få lära dig Spark Streaming, Databricks och AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maskintolkat