Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduktion till AIOps med öppen källkodsverktyg
- Översikt över AIOps koncepter och fördelar
- Prometheus och Grafana i observabilitetstacken
- Var ML passar in i AIOps: prediktiv vs. reaktiv analys
Installering av Prometheus och Grafana
- Installation och konfiguration av Prometheus för tidsseriedatainsamling
- Skapande av instrumentpaneler i Grafana med hjälp av realtidsmått
- Uppforskning av exporter, ommärkning och tjänstdiscovery
Databearbetning för ML
- Extrahering och transformering av Prometheus mått
- Förberedelse av datamängder för anomaliupptäckt och prognostisering
- Användning av Grafana transformationer eller Python pipeliner
Tillämpning av Machine Learning för anomaliupptäckt
- Grundläggande ML-modeller för utliggande detektion (t.ex. Isolation Forest, One-Class SVM)
- Träning och utvärdering av modeller på tidsseriedata
- Visualisering av anomalier i Grafana instrumentpaneler
Forecasting mått med ML
- Byggande av enkla prognosmodeller (ARIMA, Prophet, LSTM introduktion)
- Prognosering av systembelastning eller resursanvändning
- Användning av prognoser för tidig varning och skalningsbeslut
Integration av ML med varning och automatisering
- Definiering av varningsregler baserat på ML-utdata eller tröskelvärden
- Användning av Alertmanager och notifieringsvägning
- Utlösning av skript eller automatiseringsarbetsflöden vid anomaliupptäckt
Skalning och drift av AIOps
- Integration av externa observabilitetsverktyg (t.ex. ELK-stack, Moogsoft, Dynatrace)
- Drift av ML-modeller i observabilitetspipeliner
- Bästa praxis för AIOps i stor skala
Sammanfattning och nästa steg
Krav
- En förståelse för systemövervakning och observabilitetskoncept
- Erfarenhet av att använda Grafana eller Prometheus
- Kännedom om Python och grundläggande maskininlärningsprinciper
Målgrupp
- Observabilitetstekniker
- Infrastruktur- och DevOps team
- Övervakningsplattformarkitekter och site reliability engineers (SREs)
14 timmar