Kursplan

Introduktion

  • Data Science-processen
  • Roller och ansvarsområden för en data scientist

Förberedelser av utvecklingsmiljön

  • Bibliotek, ramverk, språk och verktyg
  • Lokal utveckling
  • Samarbetsbaserad webbutveckling

Datainsamling

  • Olika typer av data
    • Strukturerad
      • Lokala databaser
      • Databasanslutningar
      • Vanliga format: xlxs, XML, Json, csv, ...
    • Ostrukturerad
      • Klick, sensorer, smartphones
      • APIs
      • Internet of Things (IoT)
      • Dokument, bilder, videos, ljud
  • Fallstudie: Insamling av stora mängder ostrukturerad data kontinuerligt

Datlagring

  • Relativa databaser
  • Orelativa databaser
  • Hadoop: Distribuerat filsystem (HDFS)
  • Spark: Resilient Distributed Dataset (RDD)
  • Molnlagring

Dataprepparation

  • Inmatning, urval, rensning och transformation
  • Att säkerställa datakvalitet - korrekthet, meningsfullhet och säkerhet
  • Undantagsrapporter

Språk för preparation, bearbetning och analys

  • R-språket
    • Introduktion till R
    • Datamanipulation, beräkning och grafisk visualisering
  • Python
    • Introduktion till Python
    • Manipulation, bearbetning, rensning och analysering av data

Dataanalys

  • Utforskande analys
    • Grundläggande statistik
    • Utkast till visualiseringar
    • Förstå data
  • Kausalitet
  • Egenskaper och transformationer
  • Maskininlärning
    • Övervakad vs obevakad
    • När att använda vilket modell
  • Naturligt språkbehandling (NLP)

Datavisualisering

  • Bästa praxis
  • Välja rätt diagram för rätt data
  • Färgpaletter
  • Tagga det till nästa nivå
    • Dashboards
    • Interaktiva visualiseringar
  • Storytelling med data

Sammanfattning och slutsats

Krav

  • Generell förståelse för databasbegrepp
  • Grundläggande förståelse för statistik
 35 timmar

Antal deltagare


Pris per deltagare

Vittnesmål (4)

Kommande Kurser

Relaterade Kategorier