Kursplan

Översikt över CANNs optimeringsförmågor

  • Hur inferensprestanda hanteras i CANN
  • Optimeringsmål för kant- och inbyggda AI-system
  • Förståelse av AI Core-användning och minnesallokering

Använda Graph Engine för analys

  • Introduktion till Graph Engine och exekveringspipeline
  • Visualisering av operatorgrafik och körningsmetrik
  • Modifiering av beräkningsgrafik för optimering

Profileringsverktyg och prestandametrik

  • Användning av CANN Profiling Tool (profiler) för arbetsbelastningsanalys
  • Analys av kärnexekveringstid och flaskehalsar
  • Minnesåtkomstprofilering och tilingstrategier

Anpassad operatorutveckling med TIK

  • Översikt över TIK och operatörprogrammeringsmodellen
  • Implementering av en anpassad operator med TIK DSL
  • Testning och prestandamätning av operatören

Förbättrad operatoroptimering med TVM

  • Introduktion till TVMs integration med CANN
  • Autotuningstrategier för beräkningsgrafik
  • När och hur man ska byta mellan TVM och TIK

Minnesoptimeringstekniker

  • Hantering av minneslayout och buffertplacering
  • Tekniker för att minska on-chip-minnesförbrukningen
  • Bästa metoder för asynkron exekvering och återanvändning

Verksamhetsutveckling och fallstudier

  • Fallstudie: prestandatuning av smarta städer med kameraförlopp
  • Fallstudie: optimering av inferensstack för autonoma fordon
  • Riktlinjer för iterativ profilering och kontinuerlig förbättring

Sammanfattning och nästa steg

Krav

  • Solid kunskap om arkitektur och träningsarbetsflöden för djupinlärningsmodeller
  • Erfarenhet av modeldistribution med CANN, TensorFlow eller PyTorch
  • Förståelse för Linux CLI, shell-skript och Python-programmering

Målgrupp

  • AI-prestandaingenjörer
  • Inferensoptimeringsspecialister
  • Utvecklare som arbetar med kant-AI eller realtidsystem
 14 timmar

Antal deltagare


Pris per deltagare

Kommande Kurser

Relaterade Kategorier