Tack för att du skickade din fråga! En av våra teammedlemmar kontaktar dig snart.
Tack för att du skickade din bokning! En av våra teammedlemmar kontaktar dig snart.
Kursplan
Introduktion till AIOps
- Vad är AIOps och varför det är viktigt
- Traditionell övervakning jämfört med AIOps-driven observabilitet
- AIOps-arkitektur och kärnkomponenter
Insamling och Normalisering av Operationsdata
- Typer av observabilitetsdata: metrik, loggar och spårningar
- Att hämta data från flera källor (servrar, containrar, moln)
- Användning av agenter och exportörer (Prometheus, Beats, Fluentd)
Datakorrelation och anomalidetektering
- Tidsseriekorrelation och statistiska metoder
- Använda ML-modeller för anomalidetektering
- Identifiering av incidenter i distribuerade system
Varningar och brusreduktion
- Att designa intelligenta varningsregler och trösklar
- Suppression, deduplicering och varningsgruppering
- Integrering med Alertmanager, Slack, PagerDuty eller Opsgenie
Rotsaksanalys och visualisering
- Att använda instrumentpaneler för att visualisera metrik och identifiera trender
- Att utforska händelser och tider för Rotsaksanalys (RCA)
- Att spåra problem genom lager med distribuerade spårningsverktyg
Automation och åtgärder
- Utlösa automatiserade skript eller arbetsflöden från incidenter
- Integrering med ITSM-system (ServiceNow, Jira)
- Användningsfall: självrökande, skalning, trafikomdirigering
Open Source och Kommeriella AIOps-plattformar
- Översikt av verktyg: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Evalueringssprång för att välja en AIOps-plattform
- Demonstrations- och hands-on med ett valt stack
Sammanfattning och nästa steg
Krav
- En förståelse för IT-operationer och systemövervakningskoncept
- Erfarenhet av övervakningsverktyg eller instrumentpaneler
- Bekantskap med grundläggande logg- och metrikformat
Målgrupp
- Operationslag som är ansvariga för infrastruktur och applikationer
- Site Reliability Engineers (SREs)
- IT-övervaknings- och observabilitetsteam
14 Timmar