Kursplan

Introduktion

Förståelse Big Data

Översikt över Spark

Översikt över Python

Översikt över PySpark

  • Distribuera data med hjälp av Resilient Distributed Dataset Framework
  • Distribuera beräkningar med Spark API-operatörer

Ställa in Python med Spark

Konfigurera PySpark

Använder Amazon Web Services (AWS) EC2-instanser för Spark

Konfigurera Databricks

Konfigurera AWS EMR-klustret

Lär dig grunderna i Python Programming

  • Komma igång med Python
  • Använda Jupyter Notebook
  • Använda variabler och enkla datatyper
  • Arbeta med listor
  • Använder if-uttalanden
  • Använda användaringångar
  • Jobbar med while-loopar
  • Implementerande funktioner
  • Arbeta med klasser
  • Arbeta med filer och undantag
  • Arbeta med projekt, data och API:er

Lär dig grunderna i Spark DataFrame

  • Komma igång med Spark DataFrames
  • Implementera grundläggande operationer med Spark
  • Använda Groupby och Aggregate Operations
  • Arbeta med tidsstämplar och datum

Arbeta med en Spark DataFrame-projektövning

Förstå Machine Learning med MLlib

Arbeta med MLlib, Spark och Python för Machine Learning

Förstå regressioner

  • Lär dig linjär regressionsteori
  • Implementera en kod för utvärdering av regression
  • Arbeta med ett exempel på linjär regressionsövning
  • Lär dig logistisk regressionsteori
  • Implementera en logistisk regressionskod
  • Arbeta med ett exempel på logistisk regressionsövning

Förstå Random Forests och beslutsträd

  • Learning Tree Methods Theory
  • Genomförandebeslutsträd och Random Forest koder
  • Arbeta med ett prov Random Forest Klassificeringsövning

Arbeta med K-means Clustering

  • Förstå K-means Clustering Theory
  • Implementering av en K-means Clustering Code
  • Arbeta med en klustringsexempel

Arbeta med Recommender Systems

Implementering av naturlig språkbehandling

  • Förståelse Natural Language Processing (NLP)
  • Översikt över NLP-verktyg
  • Arbeta med en exempel på NLP-övning

Streama med Spark på Python

  • Översikt Streaming med Spark
  • Exempel Spark Streaming Övning

Avslutande kommentarer

Krav

  • Allmänna programmeringskunskaper

Publik

  • Utvecklare
  • IT-proffs
  • Dataforskare
  21 timmar
 

Antal deltagare


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Vittnesmål (5)

Relaterade Kurser

Relaterade Kategorier