Kursplan

Machine Learning Introduktion

  • Typer av maskininlärning – övervakad vs oövervakad
  • Från statistisk inlärning till maskininlärning
  • Datautvinningens arbetsflöde: förståelse för verksamheten, datapreparation, modellering, implementering
  • Att välja rätt algoritm för uppgiften
  • Överanpassning och bias-variance tradeoff

Python och översikt över ML-bibliotek

  • Varför använda programmeringsspråk för ML
  • Att välja mellan R och Python
  • Python snabbkurs och Jupyter Notebooks
  • Python bibliotek: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testning och utvärdering av ML-algoritmer

  • Generalisering, överanpassning och modellvalidering
  • Utvärderingsstrategier: holdout, korsvalidering, bootstrapping
  • Mått för regression: ME, MSE, RMSE, MAPE
  • Mått för klassificering: noggrannhet, förvirringsmatris, obalanserade klasser
  • Visualisering av modellprestanda: vinstkurva, ROC-kurva, lyftkurva
  • Modellval och rutnätssökning för justering

Datapreparation

  • Datainport och lagring i Python
  • Explorativ analys och sammanfattande statistik
  • Hantering av saknade värden och utliggare
  • Standardisering, normalisering och transformation
  • Omkodning av kvalitativa data och datahantering med pandas

Klassificeringsalgoritmer

  • Binär vs multiclass-klassificering
  • Logistisk regression och diskriminantfunktioner
  • Naïve Bayes, k-närmaste grannar
  • Beslutsgrenar: CART, Random Forests, Bagging, Boosting, XGBoost
  • Support Vector Machines och kärnor
  • Ensemble-lärningsmetoder

Regression och numerisk prediktion

  • Lägsta kvadrat och variabelval
  • Reguleringstekniker: L1, L2
  • Polynomiell regression och icke-linjära modeller
  • Regressträd och splines

Neural Networks

  • Introduktion till neurala nätverk och djupt lärande
  • Aktiveringsfunktioner, lager och backpropagation
  • Multilager perceptroner (MLP)
  • Användning av TensorFlow eller PyTorch för grundläggande neurala nätverksmodellering
  • Neurala nätverk för klassificering och regression

FörsäljningsForecasting och Predictive Analytics

  • Tidsföljd vs regressionsbaserad prognos
  • Hantering av säsongs- och trendbaserad data
  • Att bygga en försäljningsprognosmodell med ML-tekniker
  • Utvärdering av prognosnoggrannhet och osäkerhet
  • Business tolkning och kommunikation av resultat

Unsupervised Learning

  • Klustringstekniker: k-means, k-medoids, hierarkisk klustring, SOMs
  • Dimensionalitetsminskning: PCA, faktoranalys, SVD
  • Multidimensional skalning

Textutvinning

  • Textförberedelse och tokenisering
  • Bag-of-words, stamning och lemmatisering
  • Känsloanalys och ordfrekvens
  • Visualisering av textdata med ordmoln

Rekommendationssystem

  • Användarbaserad och objektbaserad kollaborativ filtrering
  • Design och utvärdering av rekommendationsmotorer

Associationsmönsterutvinning

  • Frekventa objektuppsättningar och Apriori-algoritmen
  • Marknadskorgsanalys och lyftförhållande

Upptäckt av avvikelser

  • Analys av extrema värden
  • Avståndsbaserade och täthetsbaserade metoder
  • Upptäckt av avvikelser i högdimensionella data

Machine Learning Fällstudie

  • Förståelse för verksamhetsproblemet
  • Datapreparation och egenskapshantering
  • Modellval och parametertuning
  • Utvärdering och presentation av resultat
  • Implementering

Sammanfattning och nästa steg

Krav

  • Grundläggande kunskap om maskininlärningsbegrepp såsom övervakad och oövervakad inlärning
  • Kännedom om Python-programmering (variabler, loopar, funktioner)
  • Erfarenhet av hantering av data med bibliotek som pandas eller NumPy är fördelaktigt men inte obligatoriskt
  • Ingen förkunskap om avancerad modellering eller neurala nätverk krävs

Målgrupp

  • Dataforskare
  • Business-analytiker
  • Programvaruingenjörer och tekniska professionella som arbetar med data
 28 timmar

Antal deltagare


Price per participant

Vittnesmål (2)

Upcoming Courses

Relaterade Kategorier