Kursplan

Att bygga en öppen AIOps arkitektur

  • Översikt över nyckelkomponenter i öppna AIOps pipelines
  • Dataflöde från insamling till varning
  • Jämförelse och integrationsstrategi för verktyg

Insamling och aggregering av data

  • Insamling av tidsbaserad data med Prometheus
  • Fånga loggar med Logstash och Beats
  • Normalisera data för korsreferens mellan olika källor

Bygga övervakningsinstrumentpaneler

  • Visualisera mått med Grafana
  • Bygga Kibana instrumentpaneler för logganalys
  • Använda Elasticsearch förfrågningar för att extrahera operativa insikter

Avvikelsedetektering och incidentförutsägelse

  • Exportera övervakningsdata till Python pipelines
  • Träna ML-modeller för att upptäcka avvikelser och förutspå
  • Distribuera modeller för levande inferens i övervakningspipelinen

Varning och automatisering med öppna verktyg

  • Skapa Prometheus varningsregler och Alertmanager-routing
  • Utlösa skript eller API-arbetsflöden för auto-svar
  • Använda öppen källkod orchestrationsverktyg (t.ex., Ansible, Rundeck)

Integrations- och skalbarhetsöverväganden

  • Hantera högvolyminsamling och långtidsbevarande
  • Säkerhet och åtkomstkontroll i öppen källkodstackar
  • Skala varje lager oberoende: insamling, bearbetning, varning

Principer och tillämpningar

  • Fallstudier: prestandajustering, nedtidsförebyggande och kostnadsoptimering
  • Utöka pipelines med spårningsverktyg eller tjänstegrafer
  • Bästa praxis för att köra och underhålla AIOps i produktion

Sammanfattning och nästa steg

Krav

  • Erfarenhet av övervakningsverktyg såsom Prometheus eller ELK
  • Arbetsmässig kännedom om Python och grundläggande maskininlärning
  • Förståelse för IT-operatörer och alertningsflöden

Målgrupp

  • Avancerade webbplatsreliabilitetsingenjörer (SREs)
  • Dataingenjörer som arbetar i operativa roller
  • DevOps plattformsledare och infrastrukturarkitekter
 14 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier