Apache Airflow for Data Science: Automating Machine Learning Pipelines Träningskurs
Apache Airflow är en plattform med öppen källkod för orkestrering av arbetsflöden och automatisering av komplexa datapipelines.
Denna instruktörsledda, liveutbildning (online eller på plats) riktar sig till deltagare på mellannivå som vill automatisera och hantera arbetsflöden för maskininlärning, inklusive modellträning, validering och distribution med hjälp av Apache Airflow.
I slutet av denna utbildning kommer deltagarna att kunna:
- Konfigurera Apache Airflow för orkestrering av maskininlärningsarbetsflöden.
- Automatisera förbearbetning av data, modellträning och valideringsuppgifter.
- Integrera Airflow med ramverk och verktyg för maskininlärning.
- Distribuera maskininlärningsmodeller med hjälp av automatiserade pipelines.
- Övervaka och optimera arbetsflöden för maskininlärning i produktion.
Kursens upplägg
- Interaktiv föreläsning och diskussion.
- Massor av övningar och övning.
- Praktisk implementering i en live-lab-miljö.
Alternativ för kursanpassning
- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
Kursplan
Introduktion till Apache Airflow för Machine Learning
- Översikt över Apache Airflow och dess relevans för datavetenskap
- Viktiga funktioner för att automatisera arbetsflöden för maskininlärning
- Konfigurera Airflow för datavetenskapsprojekt
Byggnad Machine Learning Rörledningar med luftflöde
- Utforma DAG:er för ML-arbetsflöden från slutpunkt till slutpunkt
- Använda operatorer för datainmatning, förbearbetning och funktionsframställning
- Schemaläggning och hantering av pipelineberoenden
Modellträning och validering
- Automatisera modellträningsuppgifter med Airflow
- Integrera luftflöde med ML-ramverk (t.ex. TensorFlow, PyTorch)
- Validera modeller och lagra utvärderingsmått
Distribution och övervakning av modeller
- Distribuera maskininlärningsmodeller med hjälp av automatiserade pipelines
- Övervaka distribuerade modeller med luftflödesuppgifter
- Hantera omträning och modelluppdateringar
Avancerad anpassning och integration
- Utveckla anpassade operatorer för ML-specifika uppgifter
- Integrera Airflow med molnplattformar och ML-tjänster
- Utöka luftflödesarbetsflöden med plugins och sensorer
Optimera och skala ML-pipelines
- Förbättra arbetsflödesprestanda för storskaliga data
- Skalning av luftflödesdistributioner med selleri och Kubernetes
- Metodtips för ML-arbetsflöden i produktionsklass
Fallstudier och praktiska tillämpningar
- Verkliga exempel på ML-automatisering med hjälp av Airflow
- Praktisk övning: Skapa en ML-pipeline från slutpunkt till slutpunkt
- Diskussion om utmaningar och lösningar inom ML-arbetsflödeshantering
Sammanfattning och nästa steg
Krav
- Kunskaper om arbetsflöden och begrepp för maskininlärning
- Grundläggande förståelse av Apache Airflow, inklusive inhemska rådgivande grupper och operatorer
- Kunskaper i Python programmering
Publik
- Datavetare
- Ingenjörer inom maskininlärning
- AI-utvecklare
Open Training Courses require 5+ participants.
Apache Airflow for Data Science: Automating Machine Learning Pipelines Träningskurs - Booking
Apache Airflow for Data Science: Automating Machine Learning Pipelines Träningskurs - Enquiry
Upcoming Courses
Relaterade Kurser
AdaBoost Python for Machine Learning
14 timmarDenna instruktörsledda, liveträning i Sverige (online eller på plats) riktar sig till datavetare och programvaruingenjörer som vill använda AdaBoost för att bygga boostande algoritmer för maskininlärning med Python.
I slutet av denna utbildning kommer deltagarna att kunna:
- Konfigurera den utvecklingsmiljö som krävs för att börja skapa maskininlärningsmodeller med AdaBoost.
- Förstå metoden för ensembleinlärning och hur du implementerar adaptiv förstärkning.
- Lär dig hur du skapar AdaBoost-modeller för att öka maskininlärningsalgoritmerna i Python.
- Använd justering av hyperparametrar för att öka noggrannheten och prestandan för AdaBoost modeller.
Anaconda Ecosystem for Data Scientists
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till datavetare som vill använda Anaconda-ekosystemet för att fånga, hantera och distribuera paket och arbetsflöden för dataanalys på en enda plattform.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Anaconda komponenter och bibliotek.
- Förstå de grundläggande begreppen, funktionerna och fördelarna med Anaconda.
- Hantera paket, miljöer och kanaler med hjälp av Anaconda Navigator.
- Använd Conda-, R- och Python-paket för datavetenskap och maskininlärning.
- Lär känna några praktiska användningsfall och tekniker för att hantera flera datamiljöer.
AutoML with Auto-Keras
14 timmarDen här instruktörsledda, live-utbildningen i Sverige (online eller på plats) riktar sig till datavetare samt mindre tekniska personer som vill använda Auto-Keras för att automatisera processen för att välja och optimera en maskininlärningsmodell.
I slutet av denna utbildning kommer deltagarna att kunna:
- Automatisera processen för att träna högeffektiva maskininlärningsmodeller.
- Sök automatiskt efter de bästa parametrarna för djupinlärningsmodeller.
- Skapa mycket exakta maskininlärningsmodeller.
- Använd kraften i maskininlärning för att lösa verkliga affärsproblem.
AutoML
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till tekniska personer med bakgrund inom maskininlärning som vill optimera de maskininlärningsmodeller som används för att upptäcka komplexa mönster i big data.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och utvärdera olika verktyg med öppen källkod AutoML (H2O AutoML, auto-sklearn, TPOT, TensorFlow, Py Torch, Auto-Keras, TPOT, Auto-WEKA, etc.)
- Träna maskininlärningsmodeller av hög kvalitet.
- Effektivt lösa olika typer av övervakade maskininlärningsproblem.
- Skriv bara den kod som krävs för att initiera den automatiserade maskininlärningsprocessen.
Creating Custom Chatbots with Google AutoML
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till deltagare med olika kompetensnivåer som vill utnyttja Googles AutoML plattform för att bygga skräddarsydda chatbots för olika applikationer.
I slutet av denna utbildning kommer deltagarna att kunna:
- Förstå grunderna för chatbot-utveckling.
- Navigera i Google Cloud Platform och få åtkomst till AutoML.
- Förbereda data för träning av chattrobotmodeller.
- Träna och utvärdera anpassade chattrobotmodeller med hjälp av AutoML.
- Distribuera och integrera chatbots i olika plattformar och kanaler.
- Övervaka och optimera chatbotens prestanda över tid.
DataRobot
7 timmarDenna instruktörsledda, liveträning i Sverige (online eller på plats) riktar sig till datavetare och dataanalytiker som vill automatisera, utvärdera och hantera prediktiva modeller med hjälp av DataRobot:s maskininlärningsfunktioner.
I slutet av denna utbildning kommer deltagarna att kunna:
- Läs in datauppsättningar i DataRobot för att analysera, utvärdera och kvalitetskontrollera data.
- Skapa och träna modeller för att identifiera viktiga variabler och uppfylla förutsägelsemål.
- Tolka modeller för att skapa värdefulla insikter som är användbara för att fatta affärsbeslut.
- Övervaka och hantera modeller för att upprätthålla en optimerad förutsägelseprestanda.
Data Mining with Weka
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till nybörjare till mellannivå dataanalytiker och datavetare som vill använda Weka för att utföra datautvinningsuppgifter.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera Weka.
- Förstå Weka-miljön och arbetsbänken.
- Utför datautvinningsuppgifter med hjälp av Weka.
Google Cloud AutoML
7 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till datavetare, dataanalytiker och utvecklare som vill utforska AutoML produkter och funktioner för att skapa och distribuera anpassade ML-träningsmodeller med minimal ansträngning.
I slutet av denna utbildning kommer deltagarna att kunna:
- Utforska produktlinjen AutoML för att implementera olika tjänster för olika datatyper.
- Förbered och märk datauppsättningar för att skapa anpassade ML-modeller.
- Träna och hantera modeller för att skapa korrekta och rättvisa maskininlärningsmodeller.
- Gör förutsägelser med hjälp av tränade modeller för att uppfylla affärsmål och behov.
Kaggle
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till datavetare och utvecklare som vill lära sig och bygga sina karriärer i Data Science med hjälp av Kaggle.
I slutet av denna utbildning kommer deltagarna att kunna:
- Lär dig mer om datavetenskap och maskininlärning.
- Utforska dataanalys.
- Lär dig mer om Kaggle och hur det fungerar.
Machine Learning for Mobile Apps using Google’s ML Kit
14 timmarDenna instruktörsledda, liveträning (online eller på plats) riktar sig till utvecklare som vill använda Googles ML Kit för att bygga maskininlärningsmodeller som är optimerade för bearbetning på mobila enheter.
I slutet av denna utbildning kommer deltagarna att kunna:
- Konfigurera den utvecklingsmiljö som krävs för att börja utveckla maskininlärningsfunktioner för mobilappar.
- Integrera nya maskininlärningstekniker i Android- och iOS-appar med hjälp av ML Kit API:er.
- Förbättra och optimera befintliga appar med hjälp av ML Kit SDK för bearbetning och distribution på enheten.
Accelerating Python Pandas Workflows with Modin
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till datavetare och utvecklare som vill använda Modin för att bygga och implementera parallella beräkningar med Pandas för snabbare dataanalys.
I slutet av denna utbildning kommer deltagarna att kunna:
- Konfigurera den miljö som krävs för att börja utveckla Pandas arbetsflöden i stor skala med Modin.
- Förstå funktionerna, arkitekturen och fördelarna med Modin.
- Känn till skillnaderna mellan Modin, Dask och Ray.
- Utför Pandas operationer snabbare med Modin.
- Implementera hela Pandas API:et och funktionerna.
Machine Learning with Random Forest
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till datavetare och programvaruingenjörer som vill använda Random Forest för att bygga maskininlärningsalgoritmer för stora datamängder.
I slutet av denna utbildning kommer deltagarna att kunna:
- Konfigurera den utvecklingsmiljö som krävs för att börja skapa maskininlärningsmodeller med slumpmässig skog.
- Förstå fördelarna med Random Forest och hur du implementerar det för att lösa klassificerings- och regressionsproblem.
- Lär dig hur du hanterar stora datamängder och tolkar flera beslutsträd i Random Forest.
- Utvärdera och optimera maskininlärningsmodellens prestanda genom att justera hyperparametrarna.
Advanced Analytics with RapidMiner
14 timmarDenna instruktörsledda, liveutbildning i Sverige (online eller på plats) riktar sig till dataanalytiker på mellannivå som vill lära sig att använda RapidMiner för att uppskatta och projicera värden och använda analysverktyg för tidsserieprognoser.
I slutet av denna utbildning kommer deltagarna att kunna:
- Lär dig att tillämpa CRISP-DM-metodiken, välja lämpliga maskininlärningsalgoritmer och förbättra modellkonstruktion och prestanda.
- Använd RapidMiner för att uppskatta och projicera värden och använda analysverktyg för tidsserieprognoser.
RapidMiner for Machine Learning and Predictive Analytics
14 timmarRapidMiner är en programvaruplattform för datavetenskap med öppen källkod för snabb prototypframställning och utveckling av applikationer. Den innehåller en integrerad miljö för förberedelse av data, maskininlärning, djupinlärning, textutvinning och prediktiv analys.
I denna instruktörsledda, liveträning kommer deltagarna att lära sig hur man använder RapidMiner Studio för dataförberedelse, maskininlärning och implementering av prediktiva modeller.
I slutet av denna utbildning kommer deltagarna att kunna:
- Installera och konfigurera RapidMiner
- Förbered och visualisera data med RapidMiner
- Verifiera maskininlärningsmodeller
- Mashup-data och skapa prediktiva modeller
- Operationalisera prediktiv analys i en affärsprocess
- Felsöka och optimera RapidMiner
Publik
- Datavetare
- Ingenjörer
- Utvecklare
Kursens upplägg
- Delvis föreläsning, delvis diskussion, övningar och tung praktisk övning
Not
- För att begära en anpassad utbildning för denna kurs, vänligen kontakta oss för att ordna.
GPU Data Science with NVIDIA RAPIDS
14 timmarDen här instruktörsledda, liveutbildningen i Sverige (online eller på plats) riktar sig till datavetare och utvecklare som vill använda RAPIDS för att skapa GPU-accelererade datapipelines, arbetsflöden och visualiseringar, genom att tillämpa maskininlärningsalgoritmer, till exempel XGBoost, cuML osv.
I slutet av denna utbildning kommer deltagarna att kunna:
- Konfigurera den utvecklingsmiljö som krävs för att bygga datamodeller med NVIDIA RAPIDS.
- Förstå funktionerna, komponenterna och fördelarna med RAPIDS.
- Utnyttja GPUs för att påskynda pipelines för data och analys från slutpunkt till slutpunkt.
- Implementera GPU-accelererad dataförberedelse och ETL med cuDF och Apache Arrow.
- Lär dig hur du utför maskininlärningsuppgifter med XGBoost- och cuML-algoritmer.
- Bygg datavisualiseringar och utför grafanalys med cuXfilter och cuGraph.