Kursplan

Införandet

  • Data Science-processen
  • Roller och ansvarsområden för en datavetare

Förbereda utvecklingsmiljön

  • Bibliotek, ramverk, språk och verktyg
  • Lokal utveckling
  • Kollaborativ webbaserad utveckling

Datainsamling

  • Olika typer av data
    • Strukturerad
      • Lokala databaser
      • Database Kontaktdon
      • Vanliga format: xlxs, XML, Json, csv, ...
    • Ostrukturerad
      • Klick, censurer, smartphones
      • Api
      • Internet of Things (IoT)
      • Dokument, bilder, videor, ljud
  • Fallstudie: Kontinuerlig insamling av stora mängder ostrukturerad data

Lagring av uppgifter

  • Relationsdatabaser
  • Icke-relationella databaser
  • Hadoop: Distribuerat filsystem (HDFS)
  • Spark: Elastisk distribuerad datauppsättning (RDD)
  • Lagring i molnet

Förberedelse av data

  • Förtäring, urval, rensning och omvandling
  • Säkerställa datakvalitet – korrekthet, meningsfullhet och säkerhet
  • Rapporter om undantag

Languages Används för beredning, bearbetning och analys.

  • R-språk
    • Introduktion till R
    • Manipulering, beräkning och grafisk visning av data
  • Python
    • Introduktion till Python
    • Manipulera, bearbeta, rensa och bearbeta data

Dataanalys

  • Undersökande analys
    • Grundläggande statistik
    • Utkast till visualiseringar
    • Förstå data
  • Kausalitet
  • Funktioner och omvandlingar
  • Machine Learning
    • Övervakad vs oövervakad
    • När du ska använda vilken modell
  • Natural Language Processing (NLP)

Data Visualization

  • Bästa praxis
  • Välja rätt diagram för rätt data
  • Färgpaletter
  • Ta det till nästa nivå
    • Instrumentbrädor
    • Interaktiva visualiseringar
  • Storytelling med data

Sammanfattning och slutsats

Krav

  • En allmän förståelse av databaskoncept
  • En grundläggande förståelse för statistik
 35 timmar

Antal deltagare


Price per participant

Vittnesmål (3)

Upcoming Courses

Relaterade Kategorier