Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduktion till AIOps
- Vad är AIOps och varför det är viktigt
- Traditionell övervakning vs. AIOps-driven observabilitet
- AIOps-arkitektur och nyckelkomponenter
Insamling och normalisering av operativ data
- Typer av observabilitetsdata: mätvärden, loggar och spår
- Inmatning av data från flera källor (servrar, containrar, moln)
- Användning av agenter och exporter (Prometheus, Beats, Fluentd)
Korrelering av data och upptäckt av avvikelser
- Korrelering av tidsserier och statistiska metoder
- Användning av ML-modeller för upptäckt av avvikelser
- Upptäckt av incidenter i fördelade system
Larm och minskning av brus
- Design av intelligenta larmer och tröskelvärden
- Undertryckning, deduplicering och gruppering av larmer
- Integration med Alertmanager, Slack, PagerDuty eller Opsgenie
Rotorsaksanalys och visualisering
- Användning av instrumentpaneler för att visualisera mätvärden och upptäcka trender
- Utforskning av händelser och tidslinjer för rotorsaksanalys
- Spårning av problem över lager med distribuerade spårningsverktyg
Automatisering och åtgärder
- Utlösning av automatiserade skript eller arbetsflöden från incidenter
- Integration med ITSM-system (ServiceNow, Jira)
- Användningsområden: självläkning, skalning, omdirigering av trafik
Öppen källkod och kommersiella AIOps-plattformar
- Översikt över verktyg: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Kriterier för utvärdering av en AIOps-plattform
- Demo och praktisk användning av ett valt stack
Sammanfattning och nästa steg
Krav
- Förståelse för IT-operations- och systemövervakningskoncept
- Erfarenhet av övervakningsverktyg eller instrumentpaneler
- Kännedom om grundläggande logg- och mätningsformat
Målgrupp
- Operationsteam som ansvarar för infrastruktur och applikationer
- Site Reliability Engineers (SREs)
- IT-övervaknings- och observabilitetsteam
14 timmar