Kursplan
Introduktion till maskinlärning
- Typer av maskinlärning – övervakad vs oövervakad
- Från statistisk inlärning till maskinlärning
- Datamining-arbetsflödet: förståelse för verksamheten, datapreparering, modellering, distribuering
- Att välja rätt algoritm för uppgiften
- Överanpassning och bias-variansteknik
Översikt över Python och ML-bibliotek
- Varför använda programspråk för ML
- Att välja mellan R och Python
- Python-kurs och Jupyter Notebooks
- Python-bibliotek: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testning och utvärdering av ML-algoritmer
- Generalisering, överanpassning och modellvalidering
- Utvärderingsstrategier: holdout, korsvalidering, bootstrapping
- Metriker för regression: ME, MSE, RMSE, MAPE
- Metriker för klassificering: noggrannhet, förvirringmatris, obalanserade klasser
- Visualisering av modellprestanda: vinstkurva, ROC-kurva, lyftkurva
- Modellval och rutan söker efter justering
Datapreparering
- Dataimport och lagring i Python
- Explorativ analys och sammanfattningsstatistik
- Hantering av saknade värden och avvikelser
- Standardisering, normalisering och transformation
- Kodning av kvalitativ data och datahantering med pandas
Klassificeringsalgoritmer
- Binär vs multiclass klassificering
- Logistisk regression och diskriminansfunktioner
- Naïve Bayes, k-nearest neighbors
- Beslutsträd: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines och kerner
- Ensemble-lärningstekniker
Regression och numerisk förutsägelse
- Minsta kvadratmetoden och variabelurval
- Reguleringstekniker: L1, L2
- Polynomiell regression och icke-linjära modeller
- Regressionsträd och splines
Neurala nätverk
- Introduktion till neurala nätverk och djupinlärning
- Aktiveringsfunktioner, lager och backpropagation
- Multilayer perceptrons (MLP)
- Användning av TensorFlow eller PyTorch för grundläggande neurala nätverksmodellering
- Neurala nätverk för klassificering och regression
Försäljningsprognoser och prediktiv analys
- Tidsseriebaserad vs regressionbaserad prognos
- Hantering av säsongs- och trendbaserad data
- Byggande av en försäljningsprognosmodell med ML-tekniker
- Utvärdering av prognosnoggrannhet och osäkerhet
- Verksamhetsbaserad tolkning och kommunikation av resultat
Oövervakad inlärning
- Klustringstekniker: k-means, k-medoids, hierarkisk klustring, SOMs
- Dimensionalitetsreduktion: PCA, faktoranalys, SVD
- Multidimensional skalning
Text mining
- Textförbehandling och tokenisering
- Bag-of-words, stammen och lemmatisering
- Känsloanalys och ordfrekvens
- Visualisering av textdata med ordmoln
Rekommendationssystem
- Användarbaserad och objektbaserad samarbetsfiltrering
- Utformning och utvärdering av rekommendationsmotor
Mönsteranalys av associationer
- Vanliga objektmängder och Apriori-algoritmen
- Marknadsbaserad analys och lyftförhållande
Utläggning av avvikelser
- Extremvärdesanalys
- Avståndsbaserade och täthetsbaserade metoder
- Utläggning av avvikelser i högdimensionella data
Maskinlärningsfallstudie
- Förståelse av affärsproblemet
- Datapreparering och funktionering
- Modellval och parameterjustering
- Utvärdering och presentation av resultat
- Distribuering
Sammanfattning och nästa steg
Krav
- Grundläggande kunskaper om maskininlärningskoncept såsom övervakad och övervakad lärande
- Kunskap om Python-programmering (variabler, loopar, funktioner)
- Något erfarenhet av datahantering med bibliotek som pandas eller NumPy är fördelaktigt men inte ett krav
- Ingen tidigare erfarenhet av avancerad modellering eller neurala nätverk förväntas
Målgrupp
- Datavetare
- Affärsanalytiker
- Programutvecklare och tekniska yrkesutövare som arbetar med data
Vittnesmål (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Kurs - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.