Kursplan
Dataförbearbetning Data Cleaning Dataintegration och transformation Datareduktion Diskretisering och begreppshierarkigenerering
Statistisk slutledning Sannolikhetsfördelningar, Slumpvariabler, Central gränssats
ProvtagningKonfidensintervallStatistisk slutsatsHypotestestningMultivariat linjär regression SpecifikationVal av delmängd
UppskattningGodkännandeFörutsägelseKlassificeringsmetoder Logistisk regressionLinjär diskriminantanalysK-närmaste grannar
Naiv BayesJämförelse av klassificeringsmetoderNeural Networks Passande neurala nätverkTräningsproblem med neurala nätverkBeslutsträd RegressionsträdKlassificeringsträd
Träd kontra linjära modellerBagging, Random Forests, Boosting BaggingRandom Forests
BoostningStöd för vektormaskiner och flexibel skivklassificerare för maximal marginalStöd vektorklassificerareStöd vektor maskiner
2 och fler klasser SVM:sFörhållande till logistisk regressionHuvudkomponentanalysKlustring K- betyder klustring
K-medoider klustringHierarkisk klustringDensitetsbaserad klustringModellbedömning och urvalsbias, varians och modellkomplexitetFörutsägelsefel i urvaletDet bayesianska synsättet
KorsvalideringBootstrap metoder