Kom i kontakt

Kursplan

Introduktion

Denna del ger en allmän introduktion till när man bör använda 'maskininlärning', vad som bör beaktas och vad det innebär, inklusive dess fördelar och nackdelar. Datatyper (strukturerade/osstrukturerade/statiska/strömmande), datagiltighet och volym, datadriven versus användardriven analys, statistiska modeller jämfört med maskininlärningsmodeller, utmaningar med osuperviserad inlärning, bias-varians-compromissen, iteration och utvärdering, korsvalideringsmetoder samt superviserad, osuperviserad och förstärkningsinlärning.

VIKTIGA INNEHÅLL

1. Förstå Naive Bayes

  • Grundläggande begrepp inom bayesianska metoder
  • Sannolikhet
  • Gemensam sannolikhet
  • Villkorlig sannolikhet med Bayes sats
  • Naive Bayes-algoritmen
  • Naive Bayes-klassificering
  • Laplace-estimatern
  • Användning av numeriska funktioner med Naive Bayes

2. Förstå beslutsträd

  • Dela och härska
  • C5.0-algoritmen för beslutsträd
  • Att välja den bästa uppdelningen
  • Beskärning av beslutsträd

3. Förstå neurala nätverk

  • Från biologiska till artificiella neuroner
  • Upphämtningsfunktioner
  • Nätverks-topologi
  • Antalet lager
  • Riktningen för informationsflödet
  • Antalet noder i varje lager
  • Träning av neurala nätverk med backpropagation
  • Djupinlärning

4. Förstå stödväxtmaskiner (Support Vector Machines)

  • Klassificering med hyperplan
  • Hitta maximal marginal
  • Fallet med linjärt separerbar data
  • Fallet med icke-linjärt separerbar data
  • Användning av kärnor för icke-linjära rum

5. Förstå klustering

  • Klustering som en maskininlärningsuppgift
  • K-means-algoritmen för klustering
  • Använda avstånd för att tilldela och uppdatera kluster
  • Välja lämpligt antal kluster

6. Mäta prestanda för klassificering

  • Arbeta med klassificeringspredikteringsdata
  • En närmare titt på förvirringsmatriser
  • Använda förvirringsmatriser för att mäta prestanda
  • Beyond accuracy – andra prestandamått
  • Kappastatistiken
  • Känslighet och specificitet
  • Precision och recall
  • F-måttet
  • Visualisering av prestanda-compromisser
  • ROC-kurvor
  • Att uppskatta framtida prestanda
  • Hållmetoden (holdout method)
  • Korsvalidering
  • Bootstrapsampling

7. Justera standardmodeller för bättre prestanda

  • Använda caret för automatisk parameterjustering
  • Skapa en enkel justerad modell
  • Skräddarsy justeringsprocessen
  • Förbättra modellprestanda med meta-inlärning
  • Förstå ensemble-metoder
  • Bagging
  • Boosting
  • Slika skogar (Random forests)
  • Träning av slika skogar
  • Utvärdera slika skogars prestanda

OKUNDA INNEHÅLL

8. Förstå klassificering med närmaste grannar

  • kNN-algoritmen
  • Beräkna avstånd
  • Välja ett lämpligt k
  • Förbereda data för användning med kNN
  • Varför är kNN-algoritmen 'lat'?

9. Förstå klassificeringsregler

  • Separera och härska
  • One Rule-algoritmen
  • RIPPER-algoritmen
  • Regler från beslutsträd

10. Förstå regression

  • Enkel linjär regression
  • Minsta kvadraters metod
  • Korrelationer
  • Multipla linjära regressioner

11. Förstå regressions-träd och modell-träd

  • Lägg till regression till träd

12. Förstå associationsregler

  • Apriori-algoritmen för associationsregelinlärning
  • Mäta regelintresse – stöd och tillitsnivå
  • Bygga en uppsättning regler med Apriori-principen

Extra

  • Spark/PySpark/MLlib och Multi-armed bandits

Krav

Python-kunskaper

 21 Timmar

Antal deltagare


Pris per deltagare

Vittnesmål (7)

Kommande Kurser

Relaterade Kategorier