Kursplan

Introduktion till AIOps

  • Vad är AIOps och varför det är viktigt
  • Traditionell övervakning jämfört med AIOps-driven observabilitet
  • AIOps-arkitektur och kärnkomponenter

Insamling och Normalisering av Operationsdata

  • Typer av observabilitetsdata: metrik, loggar och spårningar
  • Att hämta data från flera källor (servrar, containrar, moln)
  • Användning av agenter och exportörer (Prometheus, Beats, Fluentd)

Datakorrelation och anomalidetektering

  • Tidsseriekorrelation och statistiska metoder
  • Använda ML-modeller för anomalidetektering
  • Identifiering av incidenter i distribuerade system

Varningar och brusreduktion

  • Att designa intelligenta varningsregler och trösklar
  • Suppression, deduplicering och varningsgruppering
  • Integrering med Alertmanager, Slack, PagerDuty eller Opsgenie

Rotsaksanalys och visualisering

  • Att använda instrumentpaneler för att visualisera metrik och identifiera trender
  • Att utforska händelser och tider för Rotsaksanalys (RCA)
  • Att spåra problem genom lager med distribuerade spårningsverktyg

Automation och åtgärder

  • Utlösa automatiserade skript eller arbetsflöden från incidenter
  • Integrering med ITSM-system (ServiceNow, Jira)
  • Användningsfall: självrökande, skalning, trafikomdirigering

Open Source och Kommeriella AIOps-plattformar

  • Översikt av verktyg: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Evalueringssprång för att välja en AIOps-plattform
  • Demonstrations- och hands-on med ett valt stack

Sammanfattning och nästa steg

Krav

  • En förståelse för IT-operationer och systemövervakningskoncept
  • Erfarenhet av övervakningsverktyg eller instrumentpaneler
  • Bekantskap med grundläggande logg- och metrikformat

Målgrupp

  • Operationslag som är ansvariga för infrastruktur och applikationer
  • Site Reliability Engineers (SREs)
  • IT-övervaknings- och observabilitetsteam
 14 Timmar

Antal deltagare


Pris per deltagare

Kommande Kurser

Relaterade Kategorier