Kursplan

Introduktion

Principer för distribuerad datoranvändning

    Apache Spark Hadoop

Principer för Data Serialization

    Hur dataobjekt skickas över nätverket Serialisering av objekt Serialisering närmar sig Thrift Protocol Buffers Apache Avro datastruktur storlek, hastighet, formategenskaper beständig datalagring integration med dynamiska språk dynamiska skrivscheman otaggade dataändringshantering

Data Serialization och Distributed Computing

    Avro som ett delprojekt av Hadoop Java serialisering Hadoop serialisering Avro serialisering

Använder Avro med

    Hive (AvroSerDe) Pig (AvroStorage)

Portera befintliga RPC-ramverk

Sammanfattning och slutsats

Krav

  • En allmän förtrogenhet med distribuerad datoranvändning.
 14 timmar

Antal deltagare



Price per participant

Vittnesmål (3)

Relaterade Kurser

Relaterade Kategorier