Kursplan

Införandet

Förstå Big Data

Översikt över Spark

Översikt över Python

Översikt över PySpark

  • Distribuera data med hjälp av ramverket för elastiska distribuerade datamängder
  • Distribuera beräkning med hjälp av Spark API-operatorer

Konfigurera Python med Spark

Inställning PySpark

Använda Amazon Web Services (AWS) EC2-instanser för Spark

Inställning Databricks

Konfigurera AWS EMR-klustret

Att lära sig grunderna i Python Programming

  • Komma igång med Python
  • Använda Jupyter Notebook
  • Använda variabler och enkla datatyper
  • Arbeta med listor
  • Använda if-satser
  • Använda användarindata
  • Arbeta med while Loops
  • Implementera funktioner
  • Arbeta med klasser
  • Arbeta med filer och undantag
  • Arbeta med projekt, data och API:er

Lär dig grunderna i Spark DataFrame

  • Komma igång med Spark DataFrames
  • Implementera grundläggande åtgärder med Spark
  • Använda Groupby- och Aggregate-åtgärder
  • Arbeta med tidsstämplar och datum

Arbeta med en Spark DataFrame-projektövning

Förstå Machine Learning med MLlib

Arbeta med MLlib, Spark och Python för Machine Learning

Förstå regressioner

  • Att lära sig linjär regressionsteori
  • Implementera en regressionsutvärderingskod
  • Arbeta med ett exempel på en linjär regressionsövning
  • Att lära sig logistisk regressionsteori
  • Implementera en logistisk regressionskod
  • Arbeta med ett exempel på en logistisk regressionsövning

Förstå Random Forests och beslutsträd

  • Att lära sig trädmetodteori
  • Genomförande av beslutsträd och Random Forest-koder
  • Arbeta med ett urval Random Forest Klassificeringsövning

Arbeta med K-means-klustring

  • Att förstå K-means klustringsteori
  • Implementera en K-means-klustringskod
  • Arbeta med ett exempel på klustringsövning

Arbeta med rekommendationssystem

Implementera behandling av naturligt språk

  • Förstå Natural Language Processing (NLP)
  • Översikt över NLP-verktyg
  • Arbetar med ett exempel på en NLP-övning

Direktuppspelning med Spark på Python

  • Översikt Direktuppspelning med Spark
  • Exempel Spark Streaming Övning

Avslutande kommentarer

Krav

  • Allmänna programmeringskunskaper

Publik

  • Utvecklare
  • IT-proffs
  • Datavetare
 21 timmar

Antal deltagare


Price per participant

Vittnesmål (6)

Upcoming Courses