Kursplan

Introduktion till Big Data Ekosystem

  • Översikt över big data-teknologier och arkitekturer
  • Batchbearbetning vs. realtidsbearbetning
  • Datalagringsstrategier för skalbarhet

Avancerad databearbetning med Apache Spark

  • Optimering av Spark-jobb för prestanda
  • Avancerade transformationer och åtgärder
  • Arbete med strukturerad strömning

Machine Learning i stor skala

  • Fördelade modellträningstekniker
  • Hyperparameterjustering på stora datamängder
  • Modelldistribution i big data-miljöer

Deep Learning för Big Data

  • Integrering av TensorFlow och PyTorch med Spark
  • Fördelade djupinlärningsträningspipelines
  • Användningsfall i bild, text och tidsserieanalys

Realtidsanalys och dataströmning

  • Apache Kafka för strömmande datainhämtning
  • Strömningsbearbetningsramverk
  • Övervakning och alarmering i realtidssystem

Data Governance, Säkerhet och Etik

  • Dataskydd och krav på efterlevnad
  • Access kontroll och kryptering i big data-system
  • Etiska överväganden i storanalys

Integrering av Big Data med Business Intelligence

  • Datavisualisering och instrumentpaneler för big data
  • Anslutning av big data-pipelines till BI-verktyg
  • Driva affärsmål med avancerad analys

Sammanfattning och nästa steg

Krav

  • Självklar förståelse för analys av data och statistiska modelleringskoncept
  • Erfarenhet av verktyg för databearbetning och programspråk som Python, R eller Scala
  • Kännedom om fördelade beräkningsramverk som Hadoop eller Spark

Målgrupp

  • Datavetare som strävar efter att behärska storstilsdatabearbetning och prediktiv analys
  • Seniorspecialister som vill designa och implementera avancerade analytiska arbetsflöden
  • Forskare och utvecklare som fokuserar på innovativa datadrivna lösningar

 42 timmar

Antal deltagare


Price per participant

Vittnesmål (5)

Upcoming Courses

Relaterade Kategorier