Kursplan

Introduktion till Data Analysis och Big Data

    Vad gör Big Data "stor"? Hastighet, Volym, Variation, Veracity (VVVV)
Begränsningar för traditionell databehandling
  • Distribuerad bearbetning
  • Statistisk analys
  • Typer av Machine Learning analys
  • Data Visualization
  • Big Data Roller och ansvar
  • Administratörer Utvecklare Dataanalytiker

      Languages Används för dataanalys

    R Language Varför R för dataanalys? Datamanipulation, beräkning och grafisk visning

      Python Varför Python för dataanalys?
    Manipulera, bearbeta, rensa och bryta data
  • Tillvägagångssätt till Data Analysis
  • Statistisk analys Tidsserieanalys Prognos med korrelations- och regressionsmodeller Inferential Statistics (uppskattning) Beskrivande Statistics i Big Data-uppsättningar (t.ex. beräknande medelvärde)
  • Machine Learning Övervakat vs oövervakat lärande

      Klassificering och klustring
    Uppskattning av kostnaden för specifika metoder
  • Filtrering
  • Naturligt språk Bearbetning Bearbetar text
  • Förstå innebörden av texten
  • Automatisk textgenerering
  • Sentimentanalys / ämnesanalys
  • Computer Vision Inhämta, bearbeta, analysera och förstå bilder
  • Rekonstruera, tolka och förstå 3D-scener
  • Använda bilddata för att fatta beslut
  • Big Data Infrastruktur
  • Datalagring Relationsdatabaser (SQL) MySQL Postgres Oracle
  • Icke-relationella databaser (NrSQL) Cassandra
  • MongoDB
  • Neo4js
  • Förstå nyanserna Hierarkiska databaser

      Objektorienterade databaser
    Dokumentorienterade databaser
  • Graforienterade databaser
  • Övrig
  • Distribuerad bearbetning Hadoop HDFS som ett distribuerat filsystem
  • MapReduce för distribuerad bearbetning
  • Spark Allt-i-ett in-memory klusterberäkningsramverk för storskalig databehandling
  • Strukturerad streaming
  • Gnista SQL
  • Machine Learning bibliotek: MLlib
  • Grafbehandling med GraphX
  • Scalability Public cloud AWS, Google, Aliyun, etc.Privat moln OpenStack, Cloud Foundry, etc.
  • Automatisk skalbarhet
  • Att välja rätt lösning för problemet
  • Framtiden för Big Data
  • Sammanfattning och slutsats
  • Krav

    • En allmän förståelse för matematik.
    • En allmän förståelse för programmering.
    • En allmän förståelse för databaser.

    Publik

    • Utvecklare/programmerare
    • IT-konsulter
     35 timmar

    Antal deltagare



    Price per participant

    Vittnesmål (5)

    Relaterade Kategorier