Kursplan

Introduktion

  • Grafiska databaser och bibliotek

Förstå grafdata

  • Grafen som en datastruktur
  • Använda hörn (punkter) och kanter (linjer) för att modellera verkliga scenarier

Använda graf Database för att modellera, bevara och bearbeta grafdata

  • Lokala grafalgoritmer/traversals
  • neo4j, OrientDB och Titan

Övning: Modellera grafdata med neo4j

  • Whiteboard-datamodellering

Beyond Graph Databases: Graph Computing

  • Förstå egenskapsdiagrammet
  • Grafmodellering av olika scenarier (mjukvarugraf, diskussionsgraf, konceptgraf)

Lösning av verkliga problem med genomgångar

  • Algoritmisk/riktad gå över grafen
  • Bestämma cirkulära beroenden

Fallstudie: Rangordna diskussionsbidragsgivare

  • Rangordning efter antal och djup av bidragna diskussioner
  • En anteckning om sentiment och begreppsanalys

Graph Computing: Lokala, In-Memory Graph-verktygssatser

  • Grafanalys och visualisering
  • JUNG, NetworkX och iGraph

Övning: Modellera grafdata med NetworkX

  • Använda NetworkX för att modellera ett komplext system

Graph Computing: Batch Processing Graph Frameworks

  • Utnyttja Hadoop för lagring (HDFS) och bearbetning (MapReduce)
  • Översikt över iterativa algoritmer
  • Hama, Giraph och GraphLab

Graph Computing: Graph-Parallell Computation

  • Förenande ETL, utforskande analys och iterativ grafberäkning inom ett enda system
  • GraphX

Installation och installation

  • Hadoop och Spark

GraphX Operatörer

  • Egendom, strukturell, sammanfogning, grannskapsaggregation, cachning och uncaching

Itererar med Pregel API

  • Skicka argument för att skicka, ta emot och beräkna

Att bygga en graf

  • Använda hörn och kanter i en RDD eller på disk

Designa Scalable algoritmer

  • GraphX Optimering

Accessing av ytterligare algoritmer

  • PageRank, anslutna komponenter, triangelräkning

Övning: Page Rank och Top Users

  • Bygga och bearbeta grafdata med hjälp av textfiler som indata

Utplacering till produktion

Avslutande kommentarer

Krav

  • En förståelse av Java-programmering och ramverk
  • En allmän förståelse av Python är till hjälp men inte nödvändigt
  • En allmän förståelse av databaskoncept

Publik

  • Utvecklare
  28 timmar
 

Antal deltagare


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Vittnesmål (2)

Relaterade Kurser

Relaterade Kategorier