Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduktion till Predictive AIOps
- Översikt över prediktiv analys i IT-drift
- Datakällor för prediktion (loggar, mätvärden, händelser)
- Nyckelbegrepp inom tidssekvensprognostisering och anomalimönster
Design av incidentprediktionsmodeller
- Markering av historiska incidenter och systembeteende
- Val och träning av modeller (t.ex. LSTM, Random Forest, AutoML)
- Utvärdering av modellprestation och hantering av falsk-positiva resultat
Datainsamling och feature engineering
- Intag och samordning av logg- och mätvärdesdata för modellinput
- Extraktion av funktioner från strukturerade och ostrukturerade data
- Hantering av brus och saknade data i driftsledningspipeliner
Automatisering av rotorsaksanalys (RCA)
- Grafbaserad korrelation av tjänster och infrastruktur
- Användning av ML för att dra slutsatser om sannolika rotorsaker från händelsekedjor
- Visualisering av RCA med topologi-medvetna instrumentpaneler
Åtgärder och Workflow Automation
- Integration med automatiseringsplattformar (t.ex. Ansible, Rundeck)
- Utlösning av återställningar, omstart eller omdirigering av trafik
- Revisions- och dokumentation av automatiserade ingrepp
Skalning av intelligenta AIOps pipeliner
- MLOps för observabilitet: omträning och modellversionering
- Utförande av prediktioner i realtid över fördelade noder
- Bästa praxis för att distribuera AIOps i produktionsmiljöer
Fallstudier och praktiska tillämpningar
- Analys av verkliga incidentdata med hjälp av prediktiva AIOps modeller
- Distribuering av RCA-pipeliner med syntetiska och produktionsdata
- Översikt över branschfall: molnfel, instabilitet i mikrojänster, nätverksförsämringar
Sammanfattning och nästa steg
Krav
- Erfarenhet av övervakningssystem som Prometheus eller ELK
- Arbetsmetoder inom Python och grundläggande maskininlärning
- Kunskap om incidenthanteringsflöden
Målgrupp
- Äldre webbplatsreliabilitetstekniker (SREs)
- IT-automatiseringsarkitekter
- DevOps och observabilitetsplattformsledare
14 timmar