Kursplan

Översikt över CANN optimeringsmöjligheter
  • Hur inferensprestanda hanteras i CANN
  • Optimeringsmål för AI-system på gränsen och inbyggda AI-system
  • Förståelse för AI Core-utnyttjande och minnesallokering
Användning av Graph Engine för analys
  • Introduktion till Graph Engine och körningspipeline
  • Visualisering av operatörsgrafer och körningstidmetrik
  • Ändring av beräkningsgrafer för optimering
Profileringverktyg och prestandametriker
  • Användning av CANN Profileringverktyg (profilerare) för arbetsbelastningsanalys
  • Analys av kernelkörningstid och flaskhalsar
  • Minnesåtkomstprofilering och klickstrategier
Anpassad operatörsutveckling med TIK
  • Översikt över TIK och operatörsprogrammeringsmodell
  • Implementering av en anpassad operatör med TIK DSL
  • Testning och prestationsmätning av operatör
Avancerad operatörsoptimering med TVM
  • Introduktion till TVM-integrering med CANN
  • Automatiseringstrategier för beräkningsgrafer
  • När och hur man växlar mellan TVM och TIK
Minneoptimeringstekniker
  • Hantering av minneslayout och buffertplacering
  • Tekniker för att minska on-chip minnesförbrukning
  • Bästa praxis för asynkron körning och återanvändning
Verkliga tillämpningar och fallstudier
  • Fallstudie: prestandjustering för smart city-kamerapipeline
  • Fallstudie: optimering av självkörande bilars inferensstack
  • Riktlinjer för iterativ profilering och kontinuerlig förbättring
Sammanfattning och nästa steg

Krav

  • Starkt förståelse för djupinlärningsmodellsarkitekturer och träningsflöden
  • Erfarenhet av modellimplementering med CANN, TensorFlow, eller PyTorch
  • Kännedom om Linux CLI, shellsripting, och Python programmering

Målgrupp

  • AI-prestandaingenjörer
  • Specialister inom inferensoptimering
  • Utvecklare som arbetar med edge AI eller realtidsystem
 14 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier