Kursplan

Introduktion

Principer för distribuerad datoranvändning

    Apache Spark Hadoop

Principer för Data Serialization

    Hur dataobjekt skickas över nätverket Serialisering av objekt Serialisering närmar sig Thrift Protocol Buffers Apache Avro datastruktur storlek, hastighet, formategenskaper beständig datalagring integration med dynamiska språk dynamiska skrivscheman otaggade dataändringshantering

Data Serialization och Distributed Computing

    Avro som ett delprojekt av Hadoop Java serialisering Hadoop serialisering Avro serialisering

Använder Avro med

    Hive (AvroSerDe) Pig (AvroStorage)

Portera befintliga RPC-ramverk

Sammanfattning och slutsats

Krav

  • En allmän förtrogenhet med distribuerad datoranvändning.
  14 timmar
 

Antal deltagare


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.

Price per participant

Vittnesmål (3)

Relaterade Kurser

Relaterade Kategorier