Kursplan

Dag ett: Grundläggande språk

    Kursintroduktion Om Data Science Data Science Definition Process of Doing Data Science.
Vi presenterar R Language
  • Variabler och typer
  • Kontrollstrukturer (loopar/villkor)
  • R Scalars, vektorer och matriser som definierar R-vektorer
  • Matriser
  • Sträng- och textmanipulation Teckendatatyp
  • IO-filer
  • Listor
  • Funktioner Introduktion av funktioner
  • Stängningar
  • lapply/sapply-funktioner
  • Dataramar
  • Labs för alla sektioner
  • Dag två: Mellanliggande R Programming
  • DataFrames och fil-I/O Läsa data från filer Dataförberedelse Inbyggda datamängder Visualiseringsgrafik Paketplot() / barplot() / hist() / boxplot() / spridningsdiagram Värmekarta ggplot2-paket (qplot(), ggplot())
  • Utforskning med Dplyr
  • Labs för alla sektioner
  • Dag tre: Avancerad Programming Med R

      Statistisk modellering med R Statistiska funktioner som hanterar NA-fördelningar (binomial, poisson, normal)
    Regression Introduktion av linjära regressioner
  • Rekommendationer
  • Textbearbetning (tm-paket / Wordmoln)
  • Clustering Introduktion till Clustering

      KMeans
    Klassificering Introduktion till klassificering
  • Naiv Bayes
  • Beslutsträd
  • Utbildning med caret-paket
  • Utvärdera algoritmer
  • R och Big Data Ansluter R till databaser
  • Big Data Ekosystem
  • Labs för alla sektioner

    Krav

    • Grundläggande programmeringsbakgrund är att föredra

    Uppstart

    • En modern bärbar dator
    • Senaste R studio och R-miljö installerad
     21 timmar

    Antal deltagare



    Price per participant

    Vittnesmål (5)

    Relaterade Kategorier