Kursplan
Introduktion till Google Colab och Apache Spark
- Översikt över Google Colab
- Introduktion till Apache Spark
- Inställning av Spark i Google Colab
Datahantering med Apache Spark
- Arbete med RDDs och DataFrames
- Laddning och bearbetning av stora datamängder
- Användning av Spark SQL för frågeställningar av strukturerade data
Avancerad analys med Spark
- Maskininlärning med Spark MLlib
- Utförande av realtidsdataanalys
- Fördelad beräkning med Spark
Visualisering och Collaboration i Google Colab
- Integration av Colab med populära visualiseringsbibliotek
- Samarbetande arbetsflöden med Colab-anteckningar
- Delning och export av resultat
Optimering av Big Data-arbetsflöden
- Justering av Spark för prestanda
- Optimering av minnes- och lagringsanvändning
- Skalning av arbetsflöden för stora datamängder
Big Data i molnet
- Integration av Google Colab med molnbaserade verktyg
- Användning av molnlagring för big data
- Arbete med Spark i fördelade molnmiljöer
Fallstudier och bästa praxis
- Översyn av verkliga big data-applikationer
- Fallstudier med Apache Spark och Colab
- Bästa praxis för big data-analys
Sammanfattning och nästa steg
Krav
- Grundläggande kunskap om data science-begrepp
- Kännedom om Apache Spark
- Python-programmeringsfärdigheter
Målgrupp
- Data scientists
- Data engineers
- Forskare som arbetar med big data
Vittnesmål (4)
Praktiska exempel lät oss få en riktig känsla för hur programmet fungerar. Bra förklaringar och integration av teoretiska begrepp och hur de hänger ihop med praktiska tillämpningar.
Ian - Archeoworks Inc.
Kurs - ArcGIS Fundamentals
Maskintolkat
Alla ämnen som han behandlade, inklusive exempel. Han förklarade också hur de är till hjälp i vår dagliga arbetsuppgifter.
madduri madduri - Boskalis Singapore Pte Ltd
Kurs - QGIS for Geographic Information System
Maskintolkat
Jag uppskattade verkligen träningen. Jag fann att alla moduler var tillämpliga på problem som jag försöker lösa på jobbet. Integreringen av träningen med Jupyter Notebooks var verkligen imponerande.
Mark Firmin - Environment and Climate Change Canada
Kurs - Python for Geographic Information System (GIS)
Maskintolkat
Det jag tyckte mest om med utbildningen var organisationen och platsen
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Kurs - ArcGIS for Spatial Analysis
Maskintolkat