Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduktion till Predictive AIOps
- Översikt över prediktiv analys i IT-drift
- Datakällor för prediktion (loggar, mätvärden, händelser)
- Nyckelbegrepp i tidsserieframställning och avvikelsepatter
Design av Incident Prediction Models
- Märkning av historiska incidenter och systembeteende
- Val och träning av modeller (t.ex., LSTM, Random Forest, AutoML)
- Utvärdering av modellprestanda och hantering av falska positiva
Data Collection and Feature Engineering
- Inmatning och justering av logg- och mätvärdesdata för modellinput
- Extraktion av egenskaper från strukturerad och ostrukturerad data
- Hantering av brus och saknad data i driftsrörledningar
Automatisering av Root Cause Analysis (RCA)
- Grafbaserad korrelation av tjänster och infrastruktur
- Användning av ML för att dra slutsatser om sannolika orsaker från händelsekedjor
- Visualisering av RCA med topologiskt medvetna instrumentpaneler
Remediation and Workflow Automation
- Integration med automatiseringsplattformar (t.ex., Ansible, Rundeck)
- Utlösning av återgångar, omstartar eller trafikomdirigering
- Revisions- och dokumentering av automatiserade ingripanden
Scaling Intelligent AIOps Pipelines
- MLOps för observabilitet: omträning och modellversionering
- Körning av prediktioner i realtid över distribuerade noder
- Bäst praxis för distribuering av AIOps i produktionsmiljöer
Case Studies and Practical Applications
- Analys av verkliga incidentdata med prediktiva AIOps modeller
- Distribuering av RCA-rörledningar med syntetisk och produktionsdata
- Granskning av industriella användningsfall: molninstabilitet, instabilitet i mikrotjänster, nätverksdegradering
Sammanfattning och nästa steg
Krav
- Erfarenhet av övervakningssystem som Prometheus eller ELK
- Arbetskännedom om Python och grundläggande maskininlärning
- Kännedom om incidenthanteringsflöden
Målgrupp
- Äldre webbplatsansvariga ingenjörer (SREs)
- IT-automatiseringsarkitekter
- DevOps och observabilitetsplattformsledare
14 timmar