Kursplan

Introduktion till Google Colab och Apache Spark

  • Översikt över Google Colab
  • Introduktion till Apache Spark
  • Inställning av Spark i Google Colab

Datahantering med Apache Spark

  • Arbete med RDDs och DataFrames
  • Laddning och bearbetning av stora datamängder
  • Användning av Spark SQL för frågeställningar av strukturerade data

Avancerad analys med Spark

  • Maskininlärning med Spark MLlib
  • Utförande av realtidsdataanalys
  • Fördelad beräkning med Spark

Visualisering och Collaboration i Google Colab

  • Integration av Colab med populära visualiseringsbibliotek
  • Samarbetande arbetsflöden med Colab-anteckningar
  • Delning och export av resultat

Optimering av Big Data-arbetsflöden

  • Justering av Spark för prestanda
  • Optimering av minnes- och lagringsanvändning
  • Skalning av arbetsflöden för stora datamängder

Big Data i molnet

  • Integration av Google Colab med molnbaserade verktyg
  • Användning av molnlagring för big data
  • Arbete med Spark i fördelade molnmiljöer

Fallstudier och bästa praxis

  • Översyn av verkliga big data-applikationer
  • Fallstudier med Apache Spark och Colab
  • Bästa praxis för big data-analys

Sammanfattning och nästa steg

Krav

  • Grundläggande kunskap om data science-begrepp
  • Kännedom om Apache Spark
  • Python-programmeringsfärdigheter

Målgrupp

  • Data scientists
  • Data engineers
  • Forskare som arbetar med big data
 14 timmar

Antal deltagare


Price per participant

Vittnesmål (5)

Upcoming Courses

Relaterade Kategorier