Kursplan
Introduktion
Det här avsnittet ger en allmän introduktion av när man ska använda "maskininlärning", vad man bör tänka på och vad det innebär, inklusive för- och nackdelar. Datatyper (strukturerade/ostrukturerade/statiska/strömmade), datavaliditet/volym, datadriven vs användardriven analys, statistiska modeller vs. maskininlärningsmodeller/ utmaningar med oövervakad inlärning, avvägning av bias-varians, iteration/utvärdering, korsvalideringsmetoder , övervakad/obevakad/förstärkning.
HUVUDÄMNEN
1. Förstå naiva Bayes
- Grundläggande begrepp för Bayesianska metoder
- Sannolikhet
- Gemensam sannolikhet
- Betingad sannolikhet med Bayes sats
- Den naiva Bayes-algoritmen
- Den naiva Bayes-klassificeringen
- Laplace estimator
- Använder numeriska funktioner med naiva Bayes
2. Förstå beslutsträd
- Söndra och erövra
- C5.0 beslutsträdsalgoritmen
- Att välja den bästa uppdelningen
- Beskärning av beslutsträdet
3. Förstå neurala nätverk
- Från biologiska till artificiella neuroner
- Aktiveringsfunktioner
- Nätverks topologi
- Antalet lager
- Riktningen för informationsfärden
- Antalet noder i varje lager
- Träning av neurala nätverk med backpropagation
- Deep Learning
4. Förstå Support Vector Machines
- Klassificering med hyperplan
- Hitta den maximala marginalen
- Fallet med linjärt separerbara data
- Fallet med icke-linjärt separerbara data
- Använder kärnor för icke-linjära mellanslag
5. Förstå klustring
- Clustering som en maskininlärningsuppgift
- K-medelalgoritmen för klustring
- Använder avstånd för att tilldela och uppdatera kluster
- Att välja lämpligt antal kluster
6. Mätning av prestanda för klassificering
- Arbeta med klassificeringsförutsägelsedata
- En närmare titt på förvirringsmatriser
- Använda förvirringsmatriser för att mäta prestanda
- Utöver noggrannhet – andra mått på prestanda
- Kappa-statistiken
- Känslighet och specificitet
- Precision och återkallelse
- F-måttet
- Visualisera prestandaavvägningar
- ROC-kurvor
- Uppskattning av framtida prestanda
- Holdout-metoden
- Korsvalidering
- Bootstrap provtagning
7. Trimma lagermodeller för bättre prestanda
- Använder caret för automatisk parameterinställning
- Skapa en enkel trimmad modell
- Anpassa inställningsprocessen
- Förbättra modellprestanda med meta-inlärning
- Förstå ensembler
- Säckväv
- Boostning
- Slumpmässiga skogar
- Träning av slumpmässiga skogar
- Utvärdera slumpmässig skogprestanda
MINDRE ÄMNEN
8. Förstå klassificering med hjälp av närmaste grannar
- kNN-algoritmen
- Beräknar avstånd
- Att välja en lämplig k
- Förbereder data för användning med kNN
- Varför är kNN-algoritmen lat?
9. Förstå klassificeringsregler
- Separera och erövra
- The One Rule-algoritmen
- RIPPER-algoritmen
- Regler från beslutsträd
10. Förstå regression
- Enkel linjär regression
- Vanlig minsta kvadratuppskattning
- Korrelationer
- Multipel linjär regression
11. Förstå regressionsträd och modellträd
- Lägga till regression till träd
12. Förstå föreningens regler
- Apriori-algoritmen för inlärning av associationsregel
- Att mäta regelintresse – stöd och förtroende
- Att bygga en uppsättning regler med Apriori-principen
Extrafunktioner
- Spark/PySpark/MLlib och flerarmade banditer
Vittnesmål (5)
Håller det kort och enkelt. Skapa intuition och visuella modeller kring begreppen (beslutsträdsgraf, linjära ekvationer, beräkna y_pred manuellt för att bevisa hur modellen fungerar).
Nicolae - DB Global Technology
Kurs - Machine Learning
Machine Translated
Det hjälpte mig att nå mitt mål att förstå ML. Mycket respekt för Pablo för att han ger en ordentlig introduktion i detta ämne, eftersom det blir uppenbart efter 3 dagars träning hur omfattande detta ämne är. Jag har också haft MYCKET idén om virtuella maskiner du har tillhandahållit, som hade mycket bra latens! Det gjorde det möjligt för varje kursant att göra experiment i sin egen takt.
Silviu - DB Global Technology
Kurs - Machine Learning
Machine Translated
The way practical part, seeing the theory materializing into something practical is great.
Lisa Fekade - Vodacom
Kurs - Machine Learning
It's just great that all material including the exercises is on the same page and then it gets updated on the fly. The solution is revealed at the end. Cool! Also, I do appreciate that Krzysztof took extra effort to understand our problems and suggested us possible techniques.
Attila Nagy - L M ERICSSON LIMITED
Kurs - Machine Learning
I liked the lab exercises.