Kursplan

Introduktion till Apache Airflow för maskininlärning

  • Översikt över Apache Airflow och dess relevans för datavetenskap
  • Nyckelfunktioner för automatisering av maskininlärningsarbetsflöden
  • Inställning av Airflow för datavetenskapliga projekt

Byggande av maskininlärningspipelines med Airflow

  • Design av DAGs för slut-till-slut ML-arbetsflöden
  • Användning av operatörer för datainhämtning, förbehandling och egenskapskonstruktion
  • Schemaläggning och hantering av pipelinedependenser

Modellträning och validering

  • Automatisering av modellträningsuppgifter med Airflow
  • Integration av Airflow med ML-ramverk (t.ex., TensorFlow, PyTorch)
  • Validering av modeller och lagring av utvärderingsmått

Modelldistribution och övervakning

  • Distribution av maskininlärningsmodeller med automatiserade pipelines
  • Övervakning av distribuerade modeller med Airflow-uppgifter
  • Hantering av omtränings och modelluppdateringar

Avancerad anpassning och integration

  • Utveckling av anpassade operatörer för ML-specifika uppgifter
  • Integration av Airflow med molnplattformar och ML-tjänster
  • Förlängning av Airflow-arbetsflöden med plug-in och sensorer

Optimering och skalning av ML-pipelines

  • Förbättring av arbetsflödeseffektivitet för storskaliga data
  • Skalning av Airflow-distributioner med Celery och Kubernetes
  • Bäst praxis för produktionsvärdiga ML-arbetsflöden

Fallstudier och praktiska tillämpningar

  • Verkliga exempel på ML-automatisering med Airflow
  • Övning i praktiken: Byggande av en slut-till-slut ML-pipeline
  • Diskussion av utmaningar och lösningar i ML-arbetsflödeshantering

Sammanfattning och nästa steg

Krav

  • Kännedom om maskininlärningsarbetsflöden och begrepp
  • Grundläggande förståelse av Apache Airflow, inklusive DAGs och operatörer
  • Skicklighet i Python-programmering

Målgrupp

  • Data scientists
  • Maskininlärningsingenjörer
  • AI-utvecklare
 21 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier