Kursplan

Introduktion

Förståelse Big Data

Översikt över Spark

Översikt över Python

Översikt över PySpark

 • Distribuera data med hjälp av Resilient Distributed Dataset Framework
 • Distribuera beräkningar med Spark API-operatörer

Ställa in Python med Spark

Konfigurera PySpark

Använder Amazon Web Services (AWS) EC2-instanser för Spark

Konfigurera Databricks

Konfigurera AWS EMR-klustret

Lär dig grunderna i Python Programming

 • Komma igång med Python
 • Använda Jupyter Notebook
 • Använda variabler och enkla datatyper
 • Arbeta med listor
 • Använder if-uttalanden
 • Använda användaringångar
 • Jobbar med while-loopar
 • Implementerande funktioner
 • Arbeta med klasser
 • Arbeta med filer och undantag
 • Arbeta med projekt, data och API:er

Lär dig grunderna i Spark DataFrame

 • Komma igång med Spark DataFrames
 • Implementera grundläggande operationer med Spark
 • Använda Groupby och Aggregate Operations
 • Arbeta med tidsstämplar och datum

Arbeta med en Spark DataFrame-projektövning

Förstå Machine Learning med MLlib

Arbeta med MLlib, Spark och Python för Machine Learning

Förstå regressioner

 • Lär dig linjär regressionsteori
 • Implementera en kod för utvärdering av regression
 • Arbeta med ett exempel på linjär regressionsövning
 • Lär dig logistisk regressionsteori
 • Implementera en logistisk regressionskod
 • Arbeta med ett exempel på logistisk regressionsövning

Förstå Random Forests och beslutsträd

 • Learning Tree Methods Theory
 • Genomförandebeslutsträd och Random Forest koder
 • Arbeta med ett prov Random Forest Klassificeringsövning

Arbeta med K-means Clustering

 • Förstå K-means Clustering Theory
 • Implementering av en K-means Clustering Code
 • Arbeta med en klustringsexempel

Arbeta med Recommender Systems

Implementering av naturlig språkbehandling

 • Förståelse Natural Language Processing (NLP)
 • Översikt över NLP-verktyg
 • Arbeta med en exempel på NLP-övning

Streama med Spark på Python

 • Översikt Streaming med Spark
 • Exempel Spark Streaming Övning

Avslutande kommentarer

Krav

 • Allmänna programmeringskunskaper

Publik

 • Utvecklare
 • IT-proffs
 • Dataforskare
 21 timmar

Antal deltagarePrice per participant

Vittnesmål (2)

Relaterade Kategorier