Kursplan
- Machine Learning Inledning
- Typer av maskininlärning – övervakad kontra oövervakad inlärning
- Från statistisk inlärning till maskininlärning
- Arbetsflödet Data Mining:
- Business Förståelse
- Förståelse för data
- Förberedelse av data
- Modellering
- Utvärdering
- Utplacering
- Algoritmer för maskininlärning
- Välja lämplig algoritm för problemet
- Avvägning mellan överanpassning och bias-varians i ML
- ML-bibliotek och programmeringsspråk
- Varför använda ett programmeringsspråk?
- Välja mellan R och Python
- Python Snabbkurs
- Python Resurser
- Python Bibliotek för maskininlärning
- Jupyter Notebooks och interaktiv kodning
- Testa ML-algoritmer
- Generalisering och överanpassning
- Undvika överanpassning
- Holdout-metod
- Korsvalidering
- Bootstrapping
- Utvärdera numeriska förutsägelser
- Mått på noggrannhet: ME, MSE, RMSE, MAPE
- Parameter- och prediktionsstabilitet
- Utvärdera klassificeringsalgoritmer
- Noggrannhet och dess problem
- Matrisen för förvirring
- Problem med obalanserade klasser
- Visualisera modellens prestanda
- Vinstkurva
- ROC-kurva
- Lyft kurva
- Val av modell
- Modelljustering – strategier för rutnätssökning
- Exempel i Python
- Förberedelse av data
- Import och lagring av data
- Förstå data – grundläggande utforskningar
- Datamanipulering med Pandas-biblioteket
- Dataomvandlingar – Datavrängning
- Undersökande analys
- Saknade observationer – upptäckt och lösningar
- Outliers – upptäckt och strategier
- Standardisering, normalisering, binarisering
- Kvalitativ omkodning av data
- Exempel i Python
- Klassificering
- Klassificering av binär kontra flera klasser
- Klassificering via matematiska funktioner
- Linjära diskriminanta funktioner
- Kvadratiska diskriminanta funktioner
- Logistisk regression och sannolikhetsanalys
- k-närmaste grannar
- Naiva Bayes
- Beslutsträd
- KÄRRA
- Uppsamlare
- Random Forests
- Öka
- Xgboost (på engelska)
- Support Vector Maskiner och kärnor
- Klassificerare för maximal marginal
- Stöd Vector Maskin
- Ensemble lärande
- Exempel i Python
- Regression och numerisk förutsägelse
- Uppskattning av minsta kvadratmetoden
- Tekniker för val av variabler
- Regularisering och stabilitet - L1, L2
- Olinjäriteter och generaliserade minsta kvadratmetoden
- Polynom regression
- Splines för regression
- Regressionsträd
- Exempel i Python
- Oövervakad inlärning
- Klustring
- Centroidbaserad klustring – k-means, k-medoider, PAM, CLARA
- Hierarkisk klustring – Diana, Agnes
- Modellbaserad klustring - EM
- Självorganiserande kartor
- Utvärdering och bedömning av kluster
- Minskning av dimensionalitet
- Principalkomponentanalys och faktoranalys
- Nedbrytning av singulära värden
- Flerdimensionell skalning
- Exempel i Python
- Klustring
- Utvinning av text
- Förbehandling av data
- Modellen med påsar med ord
- Stamning och lemmisering
- Analysera ordfrekvenser
- Analys av sentiment
- Skapa ordmoln
- Exempel i Python
- Rekommendationsmotorer och samarbetsfiltrering
- Uppgifter om rekommendationer
- Användarbaserad samarbetsfiltrering
- Objektbaserad samarbetsfiltrering
- Exempel i Python
- Utvinning av associationsmönster
- Algoritm för frekventa objektuppsättningar
- Analys av varukorgen
- Exempel i Python
- Analys av extremvärden
- Extrem värdeanalys
- Avståndsbaserad identifiering av extremvärden
- Densitetsbaserade metoder
- Identifiering av extremvärden med hög dimension
- Exempel i Python
- Machine Learning Fallstudie
- Business Problemförståelse
- Förbehandling av data
- Val och justering av algoritmer
- Utvärdering av resultaten
- Utplacering
Krav
Kunskap och medvetenhet om Machine Learning grunderna
Vittnesmål (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Kurs - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Kurs - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback