Kursplan

Introduktion

    Data Science Processroller och ansvar för en datavetare

Förbereda utvecklingsmiljön

    Bibliotek, ramverk, språk och verktyg Lokal utveckling Samverkande webbaserad utveckling

Datainsamling

    Olika typer av datastrukturerade lokala databaser Databaskopplingar Vanliga format: xlxs, XML, Json, csv, ...
Ostrukturerade klick, censorer, smartphones
  • API:er
  • Internet of Things (IoT)
  • Dokument, bilder, videor, ljud
  • Fallstudie: Insamling av stora mängder ostrukturerad data kontinuerligt
  • DatalagringRelationsdatabaser Icke-relationella databaser Hadoop: Distributed File System (HDFS) Spark: Resilient Distributed Dataset (RDD) Molnlagring
  • Dataförberedelse
  • Förtäring, urval, rensning och omvandling Säkerställande av datakvalitet - korrekthet, meningsfullhet och säkerhet Undantagsrapporter

      Languages används för beredning, bearbetning och analys

    R-språk Introduktion till R Datamanipulation, beräkning och grafisk visning

      Python Introduktion till Python

    Manipulera, bearbeta, rensa och bryta data

      Dataanalys
    Explorativ analys Grundläggande statistik Utkast till visualiseringar Förstå data
  • Kausalitet
  • Funktioner och transformationer
  • Machine Learning Övervakad vs oövervakad

      När ska man använda vilken modell
    Natural Language Processing (NLP)
  • Data Visualization
  • Bästa metoder Välja rätt diagram för rätt data Färgpallar Ta det till nästa nivå Dashboards Interaktiva visualiseringar
  • Berättande med data
  • Sammanfattning och slutsats
  • Krav

    • En allmän förståelse av databaskoncept
    • En grundläggande förståelse för statistik
     35 timmar

    Antal deltagare



    Price per participant

    Vittnesmål (2)

    Relaterade Kategorier