Kursplan
Machine Learning Introduktion
- Typer av maskininlärning – övervakad vs oövervakad
- Från statistisk inlärning till maskininlärning
- Datautvinningens arbetsflöde: förståelse för verksamheten, datapreparation, modellering, implementering
- Att välja rätt algoritm för uppgiften
- Överanpassning och bias-variance tradeoff
Python och översikt över ML-bibliotek
- Varför använda programmeringsspråk för ML
- Att välja mellan R och Python
- Python snabbkurs och Jupyter Notebooks
- Python bibliotek: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testning och utvärdering av ML-algoritmer
- Generalisering, överanpassning och modellvalidering
- Utvärderingsstrategier: holdout, korsvalidering, bootstrapping
- Mått för regression: ME, MSE, RMSE, MAPE
- Mått för klassificering: noggrannhet, förvirringsmatris, obalanserade klasser
- Visualisering av modellprestanda: vinstkurva, ROC-kurva, lyftkurva
- Modellval och rutnätssökning för justering
Datapreparation
- Datainport och lagring i Python
- Explorativ analys och sammanfattande statistik
- Hantering av saknade värden och utliggare
- Standardisering, normalisering och transformation
- Omkodning av kvalitativa data och datahantering med pandas
Klassificeringsalgoritmer
- Binär vs multiclass-klassificering
- Logistisk regression och diskriminantfunktioner
- Naïve Bayes, k-närmaste grannar
- Beslutsgrenar: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines och kärnor
- Ensemble-lärningsmetoder
Regression och numerisk prediktion
- Lägsta kvadrat och variabelval
- Reguleringstekniker: L1, L2
- Polynomiell regression och icke-linjära modeller
- Regressträd och splines
Neural Networks
- Introduktion till neurala nätverk och djupt lärande
- Aktiveringsfunktioner, lager och backpropagation
- Multilager perceptroner (MLP)
- Användning av TensorFlow eller PyTorch för grundläggande neurala nätverksmodellering
- Neurala nätverk för klassificering och regression
FörsäljningsForecasting och Predictive Analytics
- Tidsföljd vs regressionsbaserad prognos
- Hantering av säsongs- och trendbaserad data
- Att bygga en försäljningsprognosmodell med ML-tekniker
- Utvärdering av prognosnoggrannhet och osäkerhet
- Business tolkning och kommunikation av resultat
Unsupervised Learning
- Klustringstekniker: k-means, k-medoids, hierarkisk klustring, SOMs
- Dimensionalitetsminskning: PCA, faktoranalys, SVD
- Multidimensional skalning
Textutvinning
- Textförberedelse och tokenisering
- Bag-of-words, stamning och lemmatisering
- Känsloanalys och ordfrekvens
- Visualisering av textdata med ordmoln
Rekommendationssystem
- Användarbaserad och objektbaserad kollaborativ filtrering
- Design och utvärdering av rekommendationsmotorer
Associationsmönsterutvinning
- Frekventa objektuppsättningar och Apriori-algoritmen
- Marknadskorgsanalys och lyftförhållande
Upptäckt av avvikelser
- Analys av extrema värden
- Avståndsbaserade och täthetsbaserade metoder
- Upptäckt av avvikelser i högdimensionella data
Machine Learning Fällstudie
- Förståelse för verksamhetsproblemet
- Datapreparation och egenskapshantering
- Modellval och parametertuning
- Utvärdering och presentation av resultat
- Implementering
Sammanfattning och nästa steg
Krav
- Grundläggande kunskap om maskininlärningsbegrepp såsom övervakad och oövervakad inlärning
- Kännedom om Python-programmering (variabler, loopar, funktioner)
- Erfarenhet av hantering av data med bibliotek som pandas eller NumPy är fördelaktigt men inte obligatoriskt
- Ingen förkunskap om avancerad modellering eller neurala nätverk krävs
Målgrupp
- Dataforskare
- Business-analytiker
- Programvaruingenjörer och tekniska professionella som arbetar med data
Vittnesmål (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Kurs - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.