Kursplan
Grundläggande agenta system i produktionsmiljöer
- Agenta arkitekturer: slingor, verktyg, minne och orkestreringsskikt
- Livscykel för agenter: utveckling, distribution och kontinuerlig drift
- Utmaningar med produktionsanvändade agenthantering
Infrastruktur och distributionsmodeller
- Distribuera agenter i containeriserade och molnmiljöer
- Skalningsmönster: horisontell vs vertikal skalning, samtidighet och begränsning
- Multi-agent orkestrering och belastningsutjämning
Övervakning och observabilitet
- Nyckelmätningar: latens, framgångssats, minnesanvändning och anropsdjup för agenter
- Spåra agentaktivitet och anropsgraf
- Instrumentera observabilitet med Prometheus, OpenTelemetry och Grafana
Loggning, granskning och kompatibilitet
- Centraliserad loggning och strukturerad händelsesamling
- Kompatibilitet och granskbarhet i agenta arbetsflöden
- Designa granskningsspår och omloppsmekanismer för felsökning
Prestandatuning och resursoptimering
- Minska inferenskostnader och optimera agentorkestreringcyklar
- Modellcachning och lättviktsinbäddningar för snabbare hämtning
- Belastningstestning och stressscenarier för AI-pipelines
Kostnadskontroll och styrning
- Förstå kostnadsdrivare för agenter: API-anrop, minne, beräkning och externa integrationer
- Spåra agentnivåkostnader och implementera chargeback-modeller
- Automatiseringspolicy för att förebygga agent spridning och idle resursanvändning
CI/CD och distributionsstrategier för agenter
- Integrera agentpipelines i CI/CD-system
- Testning, versioneringshantering och rollback-strategier för iterativa agentuppdateringar
- Progressiva distributioner och säkra distributionsmekanismer
Felåterhämtning och tillförlitlighetsingenjörskonst
- Designa för fel tolerance och graceful degradation
- Retry, timeout- och circuit breaker-mönster för agenttillförlitlighet
- Incidenthantering och efterhandstolkningsramar för AI-operationer
Kapstensprojekt
- Bygg och distribuera ett agenta AI-system med full övervakning och kostnadsspårning
- Simulera belastning, mät prestanda och optimer resursanvändning
- Presentera slutgiltig arkitektur och övervakningsinstrumentpanel till medarbetare
Sammanfattning och nästa steg
Krav
- Stark förståelse för MLOps och produktionsanvändade maskininlärningssystem
- Erfarenhet av containeriserade distributioner (Docker/Kubernetes)
- Bekantskap med molnkostnadsövervakning och observabilitetsverktyg
Målgrupp
- MLOps-ingenjörer
- Site Reliability Engineers (SREs)
- Ingenjörschefer som övervakar AI-infrastruktur
Vittnesmål (3)
God blandning av kunskap och praktik
Ion Mironescu - Facultatea S.A.I.A.P.M.
Kurs - Agentic AI for Enterprise Applications
Maskintolkat
Blandningen av teori och praktik samt av högnivå- och lågnivåperspektiv
Ion Mironescu - Facultatea S.A.I.A.P.M.
Kurs - Autonomous Decision-Making with Agentic AI
Maskintolkat
Praktiska övningar
Daniel - Facultatea S.A.I.A.P.M.
Kurs - Agentic AI in Multi-Agent Systems
Maskintolkat