Kursplan

Introduktion till maskinlärning

  • Typer av maskinlärning – övervakad vs oövervakad
  • Från statistisk inlärning till maskinlärning
  • Datamining-arbetsflödet: förståelse för verksamheten, datapreparering, modellering, distribuering
  • Att välja rätt algoritm för uppgiften
  • Överanpassning och bias-variansteknik

Översikt över Python och ML-bibliotek

  • Varför använda programspråk för ML
  • Att välja mellan R och Python
  • Python-kurs och Jupyter Notebooks
  • Python-bibliotek: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testning och utvärdering av ML-algoritmer

  • Generalisering, överanpassning och modellvalidering
  • Utvärderingsstrategier: holdout, korsvalidering, bootstrapping
  • Metriker för regression: ME, MSE, RMSE, MAPE
  • Metriker för klassificering: noggrannhet, förvirringmatris, obalanserade klasser
  • Visualisering av modellprestanda: vinstkurva, ROC-kurva, lyftkurva
  • Modellval och rutan söker efter justering

Datapreparering

  • Dataimport och lagring i Python
  • Explorativ analys och sammanfattningsstatistik
  • Hantering av saknade värden och avvikelser
  • Standardisering, normalisering och transformation
  • Kodning av kvalitativ data och datahantering med pandas

Klassificeringsalgoritmer

  • Binär vs multiclass klassificering
  • Logistisk regression och diskriminansfunktioner
  • Naïve Bayes, k-nearest neighbors
  • Beslutsträd: CART, Random Forests, Bagging, Boosting, XGBoost
  • Support Vector Machines och kerner
  • Ensemble-lärningstekniker

Regression och numerisk förutsägelse

  • Minsta kvadratmetoden och variabelurval
  • Reguleringstekniker: L1, L2
  • Polynomiell regression och icke-linjära modeller
  • Regressionsträd och splines

Neurala nätverk

  • Introduktion till neurala nätverk och djupinlärning
  • Aktiveringsfunktioner, lager och backpropagation
  • Multilayer perceptrons (MLP)
  • Användning av TensorFlow eller PyTorch för grundläggande neurala nätverksmodellering
  • Neurala nätverk för klassificering och regression

Försäljningsprognoser och prediktiv analys

  • Tidsseriebaserad vs regressionbaserad prognos
  • Hantering av säsongs- och trendbaserad data
  • Byggande av en försäljningsprognosmodell med ML-tekniker
  • Utvärdering av prognosnoggrannhet och osäkerhet
  • Verksamhetsbaserad tolkning och kommunikation av resultat

Oövervakad inlärning

  • Klustringstekniker: k-means, k-medoids, hierarkisk klustring, SOMs
  • Dimensionalitetsreduktion: PCA, faktoranalys, SVD
  • Multidimensional skalning

Text mining

  • Textförbehandling och tokenisering
  • Bag-of-words, stammen och lemmatisering
  • Känsloanalys och ordfrekvens
  • Visualisering av textdata med ordmoln

Rekommendationssystem

  • Användarbaserad och objektbaserad samarbetsfiltrering
  • Utformning och utvärdering av rekommendationsmotor

Mönsteranalys av associationer

  • Vanliga objektmängder och Apriori-algoritmen
  • Marknadsbaserad analys och lyftförhållande

Utläggning av avvikelser

  • Extremvärdesanalys
  • Avståndsbaserade och täthetsbaserade metoder
  • Utläggning av avvikelser i högdimensionella data

Maskinlärningsfallstudie

  • Förståelse av affärsproblemet
  • Datapreparering och funktionering
  • Modellval och parameterjustering
  • Utvärdering och presentation av resultat
  • Distribuering

Sammanfattning och nästa steg

Krav

  • Grundläggande kunskaper om maskininlärningskoncept såsom övervakad och övervakad lärande
  • Kunskap om Python-programmering (variabler, loopar, funktioner)
  • Något erfarenhet av datahantering med bibliotek som pandas eller NumPy är fördelaktigt men inte ett krav
  • Ingen tidigare erfarenhet av avancerad modellering eller neurala nätverk förväntas

Målgrupp

  • Datavetare
  • Affärsanalytiker
  • Programutvecklare och tekniska yrkesutövare som arbetar med data
 28 timmar

Antal deltagare


Price per participant

Vittnesmål (2)

Upcoming Courses

Relaterade Kategorier