Kursplan

Introduktion till AIOps

  • Vad är AIOps och varför det är viktigt
  • Traditionell övervakning vs. AIOps-driven observabilitet
  • AIOps arkitektur och nyckelkomponenter

Samla in och normalisera driftdata

  • Typer av observabilitetsdata: mätvärden, loggar och spår
  • Att ta in data från flera källor (servrar, containrar, moln)
  • Använda agenter och exporter (Prometheus, Beats, Fluentd)

Datakorrelation och anomalidetektering

  • Tidsseriekorrelation och statistiska metoder
  • Använda ML-modeller för anomalidetektering
  • Detektera händelser i distribuerade system

Varningar och minskning av brus

  • Designa intelligenta varningsregler och tröskelvärden
  • Undertryckning, avdubbling och gruppindelning av varningar
  • Integrera med Alertmanager, Slack, PagerDuty eller Opsgenie

Rotorsaksanalys och visualisering

  • Använda instrumentpaneler för att visualisera mätvärden och upptäcka trender
  • Undersöka händelser och tidslinjer för RCA
  • Spåra problem över lager med distribuerade spårningsverktyg

Automatisering och åtgärder

  • Utlösa automatiska skript eller arbetsflöden från händelser
  • Integrera med ITSM-system (ServiceNow, Jira)
  • Användningsområden: självläkande, skalning, trafikomdirigering

Öppen källkod och kommersiella AIOps plattformar

  • Översikt över verktyg: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Utvärderingskriterier för att välja en AIOps plattform
  • Demo och praktisk övning med ett valt stack

Sammanfattning och nästa steg

Krav

  • En förståelse för IT-drift och systemövervakningskoncept
  • Erfarenhet av övervakningsverktyg eller instrumentpaneler
  • Kännedom om grundläggande logg- och mätformater

Målgrupp

  • Driftteam ansvariga för infrastruktur och applikationer
  • Site Reliability Engineers (SREs)
  • IT-övervaknings- och observabilitetsteam
 14 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier