Kursplan

Grundläggande agenta system i produktionsmiljöer

  • Agenta arkitekturer: slingor, verktyg, minne och orkestreringsskikt
  • Livscykel för agenter: utveckling, distribution och kontinuerlig drift
  • Utmaningar med produktionsanvändade agenthantering

Infrastruktur och distributionsmodeller

  • Distribuera agenter i containeriserade och molnmiljöer
  • Skalningsmönster: horisontell vs vertikal skalning, samtidighet och begränsning
  • Multi-agent orkestrering och belastningsutjämning

Övervakning och observabilitet

  • Nyckelmätningar: latens, framgångssats, minnesanvändning och anropsdjup för agenter
  • Spåra agentaktivitet och anropsgraf
  • Instrumentera observabilitet med Prometheus, OpenTelemetry och Grafana

Loggning, granskning och kompatibilitet

  • Centraliserad loggning och strukturerad händelsesamling
  • Kompatibilitet och granskbarhet i agenta arbetsflöden
  • Designa granskningsspår och omloppsmekanismer för felsökning

Prestandatuning och resursoptimering

  • Minska inferenskostnader och optimera agentorkestreringcyklar
  • Modellcachning och lättviktsinbäddningar för snabbare hämtning
  • Belastningstestning och stressscenarier för AI-pipelines

Kostnadskontroll och styrning

  • Förstå kostnadsdrivare för agenter: API-anrop, minne, beräkning och externa integrationer
  • Spåra agentnivåkostnader och implementera chargeback-modeller
  • Automatiseringspolicy för att förebygga agent spridning och idle resursanvändning

CI/CD och distributionsstrategier för agenter

  • Integrera agentpipelines i CI/CD-system
  • Testning, versioneringshantering och rollback-strategier för iterativa agentuppdateringar
  • Progressiva distributioner och säkra distributionsmekanismer

Felåterhämtning och tillförlitlighetsingenjörskonst

  • Designa för fel tolerance och graceful degradation
  • Retry, timeout- och circuit breaker-mönster för agenttillförlitlighet
  • Incidenthantering och efterhandstolkningsramar för AI-operationer

Kapstensprojekt

  • Bygg och distribuera ett agenta AI-system med full övervakning och kostnadsspårning
  • Simulera belastning, mät prestanda och optimer resursanvändning
  • Presentera slutgiltig arkitektur och övervakningsinstrumentpanel till medarbetare

Sammanfattning och nästa steg

Krav

  • Stark förståelse för MLOps och produktionsanvändade maskininlärningssystem
  • Erfarenhet av containeriserade distributioner (Docker/Kubernetes)
  • Bekantskap med molnkostnadsövervakning och observabilitetsverktyg

Målgrupp

  • MLOps-ingenjörer
  • Site Reliability Engineers (SREs)
  • Ingenjörschefer som övervakar AI-infrastruktur
 21 timmar

Antal deltagare


Pris per deltagare

Vittnesmål (3)

Kommande Kurser

Relaterade Kategorier