Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduktion till AIOps
- Vad är AIOps och varför det är viktigt
- Traditionell övervakning vs. AIOps-driven observabilitet
- AIOps arkitektur och nyckelkomponenter
Samla in och normalisera driftdata
- Typer av observabilitetsdata: mätvärden, loggar och spår
- Att ta in data från flera källor (servrar, containrar, moln)
- Använda agenter och exporter (Prometheus, Beats, Fluentd)
Datakorrelation och anomalidetektering
- Tidsseriekorrelation och statistiska metoder
- Använda ML-modeller för anomalidetektering
- Detektera händelser i distribuerade system
Varningar och minskning av brus
- Designa intelligenta varningsregler och tröskelvärden
- Undertryckning, avdubbling och gruppindelning av varningar
- Integrera med Alertmanager, Slack, PagerDuty eller Opsgenie
Rotorsaksanalys och visualisering
- Använda instrumentpaneler för att visualisera mätvärden och upptäcka trender
- Undersöka händelser och tidslinjer för RCA
- Spåra problem över lager med distribuerade spårningsverktyg
Automatisering och åtgärder
- Utlösa automatiska skript eller arbetsflöden från händelser
- Integrera med ITSM-system (ServiceNow, Jira)
- Användningsområden: självläkande, skalning, trafikomdirigering
Öppen källkod och kommersiella AIOps plattformar
- Översikt över verktyg: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Utvärderingskriterier för att välja en AIOps plattform
- Demo och praktisk övning med ett valt stack
Sammanfattning och nästa steg
Krav
- En förståelse för IT-drift och systemövervakningskoncept
- Erfarenhet av övervakningsverktyg eller instrumentpaneler
- Kännedom om grundläggande logg- och mätformater
Målgrupp
- Driftteam ansvariga för infrastruktur och applikationer
- Site Reliability Engineers (SREs)
- IT-övervaknings- och observabilitetsteam
14 timmar