Kursplan

Dag ett: Språkliga grunderna

  • Kursintroduktion
  • Om Data Science
    • Data Science Definition
    • Processen att utföra Data Science.
  • Introduktion av R Language
  • Variabler och typer
  • Kontrollstrukturer (Loopar / Betingelser)
  • R Skalärer, vektorer och matriser
    • Definiera R-vektorer
    • Matricer
  • Sträng och textmanipulation
    • Tecken datatyp
    • Fil-IO
  • Listor
  • Funktioner
    • Introduktion av funktioner
    • Stängningar
    • lapply/sapply funktioner
  • DataFrames
  • Laborationer för alla avsnitt

Dag två: Mellannivå R Programming

  • DataFrames och Fil-IO
  • Läsa in data från filer
  • Dataförberedelse
  • Inbyggda datasets
  • Visualisering
    • Grafikpaket
    • plot() / stapeldiagram() / hist() / boxplot() / spridningsdiagram
    • Heatmap
    • ggplot2-paket (qplot(), ggplot())
  • Utforskning med Dplyr
  • Laborationer för alla avsnitt

Dag tre: Avancerad Programming med R

  • Statistisk modellering med R
    • Statistiska funktioner
    • Hantering av NA
    • Fördelningar (Binomial, Poisson, Normal)
  • Regression
    • Introduktion av linjära regressioner
  • Rekommendationer
  • Textbehandling (tm-paket / Wordmoln)
  • Klustring
    • Introduktion till klustring
    • KMeans
  • Klassificering
    • Introduktion till klassificering
    • Naive Bayes
    • Beslutsträd
    • Träning med caret-paket
    • Utvärdering av algoritmer
  • R och Big Data
    • Ansluta R till databaser
    • Big Data Ecosystem
  • Laborationer för alla avsnitt

Krav

  • Grundläggande programmeringskunskaper är föredraget

Uppsättning

 21 timmar

Antal deltagare


Price per participant

Vittnesmål (7)

Upcoming Courses

Relaterade Kategorier