Tack för att du skickade din fråga! En av våra teammedlemmar kontaktar dig snart.
Tack för att du skickade din bokning! En av våra teammedlemmar kontaktar dig snart.
Kursplan
Introduktion
- Data Science-processen
- Roller och ansvarsområden för en data scientist
Förberedelser av utvecklingsmiljön
- Bibliotek, ramverk, språk och verktyg
- Lokal utveckling
- Samarbetsbaserad webbutveckling
Datainsamling
-
Olika typer av data
-
Strukturerad
- Lokala databaser
- Databasanslutningar
- Vanliga format: xlxs, XML, Json, csv, ...
-
Ostrukturerad
- Klick, sensorer, smartphones
- APIs
- Internet of Things (IoT)
- Dokument, bilder, videos, ljud
-
Strukturerad
- Fallstudie: Insamling av stora mängder ostrukturerad data kontinuerligt
Datlagring
- Relativa databaser
- Orelativa databaser
- Hadoop: Distribuerat filsystem (HDFS)
- Spark: Resilient Distributed Dataset (RDD)
- Molnlagring
Dataprepparation
- Inmatning, urval, rensning och transformation
- Att säkerställa datakvalitet - korrekthet, meningsfullhet och säkerhet
- Undantagsrapporter
Språk för preparation, bearbetning och analys
-
R-språket
- Introduktion till R
- Datamanipulation, beräkning och grafisk visualisering
-
Python
- Introduktion till Python
- Manipulation, bearbetning, rensning och analysering av data
Dataanalys
-
Utforskande analys
- Grundläggande statistik
- Utkast till visualiseringar
- Förstå data
- Kausalitet
- Egenskaper och transformationer
-
Maskininlärning
- Övervakad vs obevakad
- När att använda vilket modell
- Naturligt språkbehandling (NLP)
Datavisualisering
- Bästa praxis
- Välja rätt diagram för rätt data
- Färgpaletter
-
Tagga det till nästa nivå
- Dashboards
- Interaktiva visualiseringar
- Storytelling med data
Sammanfattning och slutsats
Krav
- Generell förståelse för databasbegrepp
- Grundläggande förståelse för statistik
35 timmar
Vittnesmål (1)
Riktigt världskunskap från någon i branschen
Matthew Cerbas - Shield Consulting Solutions, Inc.
Kurs - Grafana
Maskintolkat