Kursplan

  1. Grundläggande om stora data
    • Big Data och dess roll i företagsvärlden
    • Faserna i utvecklingen av en Big Data strategi inom ett företag
    • Förklara logiken bakom en holistisk syn på Big Data
    • Komponenter som behövs i en Big Data Plattform
    • Stor datalagringslösning
    • Begränsningar för traditionell teknik
    • Översikt över databastyper
    • De fyra dimensionerna av Big Data
  2. Stor datapåverkan på verksamheten
    • Business betydelsen av Big Data
    • Utmaningar med att extrahera användbar data
    • Integrera Big data med traditionell data
  3. Stordatalagringsteknik
    • Översikt över big data-tekniker
      • Datalagringsmodeller
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Att välja rätt big data-teknik
  4. Bearbetar big data
    • Ansluta och extrahera data från databasen
    • Transformering och förberedelse av data för bearbetning
    • Använder Hadoop MapReduce för att bearbeta distribuerad data
    • Övervaka och utföra Hadoop MapReduce-jobb
    • Hadoop distribuerade filsystems byggstenar
    • Mapreduce och Yarn
    • Hantera strömmande data med Spark
  5. Big data analysverktyg och teknologier
    • Programming Hadoop med gris latinsk språk
    • Söka efter big data med Hive
    • Mining data med Mahout
    • Visualiserings- och rapporteringsverktyg
  6. Big data i näringslivet
    • Hantera och fastställa Big Data behov
    • Business betydelsen av Big Data
    • Att välja rätt big data-verktyg för problemet

Datalagerkoncept

  • Vad är Data Ware House?
  • Skillnaden mellan OLTP och Data Ware Housing
  • Datainsamling
  • Dataextraktion
  • Datatransformation.
  • Dataladdning
  • Data Marts
  • Beroende vs oberoende data Mart
  • Databasdesign

ETL-testkoncept:

  • Introduktion.
  • Mjukvaruutveckling livscykel.
  • Testmetoder.
  • ETL-testning av arbetsflödesprocess.
  • ETL-testningsansvar i datastadiet.

Big data Fundamentals

  • Big Data och dess roll i företagsvärlden
  • Faserna i utvecklingen av en Big Data strategi inom ett företag
  • Förklara logiken bakom en holistisk syn på Big Data
  • Komponenter som behövs i en Big Data Plattform
  • Stor datalagringslösning
  • Begränsningar för traditionell teknik
  • Översikt över databastyper

NoSQL Databases

Hadoop

Karta Minska

Apache Spark

Krav

Delegater bör ha en medvetenhet och viss erfarenhet av lagringsverktyg och en medvetenhet om att hantera stora datamängder

 14 timmar

Antal deltagare



Price per participant

Vittnesmål (4)

Relaterade Kurser

Relaterade Kategorier