Kursplan

Dag Ett: Grundläggande Språk

  • Kursintroduktion
  • Om Data Science
    • Definition av Data Science
    • Processen för att utföra Data Science.
  • Introduktion till R-språket
  • Variabler och typer
  • Kontrollstrukturer (Loops / Conditionals)
  • R Scalars, Vektorer, och Matriser
    • Definiera R-vektorer
    • Matriser
  • Sträng- och textmanipulation
    • Karaktärdatatyp
    • Fil-I/O
  • Listor
  • Funktioner
    • Introduktion till funktioner
    • Closures
    • lapply/sapply-funktioner
  • DataFrames
  • Laborationer för alla avsnitt

Dag Två: Mellanliggande R-programmering

  • DataFrames och fil-I/O
  • Läsa data från filer
  • Datapreparation
  • Inbyggda dataset
  • Visualisering
    • Graphics Package
    • plot() / barplot() / hist() / boxplot() / scatter plot
    • Heat Map
    • ggplot2 package (qplot(), ggplot())
  • Utforskning med Dplyr
  • Laborationer för alla avsnitt

Dag Tre: Avancerad programmering med R

  • Statistisk modellering med R
    • Statistiska funktioner
    • Hantering av NA
    • Fördelningar (Binomial, Poisson, Normal)
  • Regressionsanalys
    • Introduktion till linjär regression
  • Rekommendationer
  • Textbearbetning (tm-paket / Wordclouds)
  • Klusteranalys
    • Introduktion till klusteranalys
    • KMeans
  • Klassificering
    • Introduktion till klassificering
    • Naive Bayes
    • Beslutsträd
    • Träningsprocess med caret-paketet
    • Utvärdering av algoritmer
  • R och Big Data
    • Anslutning av R till databaser
    • Big Data-ekosystemet
  • Laborationer för alla avsnitt

Krav

  • Grundläggande programmeringsbakgrund är önskvärd

Inställning

  • En modern laptop
  • Senaste R Studio och R-miljö installerat
 21 timmar

Antal deltagare


Pris per deltagare

Vittnesmål (7)

Kommande Kurser

Relaterade Kategorier