Kursplan

Introduktion till AIOps

  • Vad är AIOps och varför det är viktigt
  • Traditionell övervakning vs. AIOps-driven observabilitet
  • AIOps-arkitektur och nyckelkomponenter

Insamling och normalisering av operativ data

  • Typer av observabilitetsdata: mätvärden, loggar och spår
  • Inmatning av data från flera källor (servrar, containrar, moln)
  • Användning av agenter och exporter (Prometheus, Beats, Fluentd)

Korrelering av data och upptäckt av avvikelser

  • Korrelering av tidsserier och statistiska metoder
  • Användning av ML-modeller för upptäckt av avvikelser
  • Upptäckt av incidenter i fördelade system

Larm och minskning av brus

  • Design av intelligenta larmer och tröskelvärden
  • Undertryckning, deduplicering och gruppering av larmer
  • Integration med Alertmanager, Slack, PagerDuty eller Opsgenie

Rotorsaksanalys och visualisering

  • Användning av instrumentpaneler för att visualisera mätvärden och upptäcka trender
  • Utforskning av händelser och tidslinjer för rotorsaksanalys
  • Spårning av problem över lager med distribuerade spårningsverktyg

Automatisering och åtgärder

  • Utlösning av automatiserade skript eller arbetsflöden från incidenter
  • Integration med ITSM-system (ServiceNow, Jira)
  • Användningsområden: självläkning, skalning, omdirigering av trafik

Öppen källkod och kommersiella AIOps-plattformar

  • Översikt över verktyg: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Kriterier för utvärdering av en AIOps-plattform
  • Demo och praktisk användning av ett valt stack

Sammanfattning och nästa steg

Krav

  • Förståelse för IT-operations- och systemövervakningskoncept
  • Erfarenhet av övervakningsverktyg eller instrumentpaneler
  • Kännedom om grundläggande logg- och mätningsformat

Målgrupp

  • Operationsteam som ansvarar för infrastruktur och applikationer
  • Site Reliability Engineers (SREs)
  • IT-övervaknings- och observabilitetsteam
 14 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier