Tack för att du skickade din fråga! En av våra teammedlemmar kontaktar dig snart.
Tack för att du skickade din bokning! En av våra teammedlemmar kontaktar dig snart.
Kursplan
Översikt över CANNs optimeringsförmågor
- Hur inferensprestanda hanteras i CANN
- Optimeringsmål för kant- och inbyggda AI-system
- Förståelse av AI Core-användning och minnesallokering
Använda Graph Engine för analys
- Introduktion till Graph Engine och exekveringspipeline
- Visualisering av operatorgrafik och körningsmetrik
- Modifiering av beräkningsgrafik för optimering
Profileringsverktyg och prestandametrik
- Användning av CANN Profiling Tool (profiler) för arbetsbelastningsanalys
- Analys av kärnexekveringstid och flaskehalsar
- Minnesåtkomstprofilering och tilingstrategier
Anpassad operatorutveckling med TIK
- Översikt över TIK och operatörprogrammeringsmodellen
- Implementering av en anpassad operator med TIK DSL
- Testning och prestandamätning av operatören
Förbättrad operatoroptimering med TVM
- Introduktion till TVMs integration med CANN
- Autotuningstrategier för beräkningsgrafik
- När och hur man ska byta mellan TVM och TIK
Minnesoptimeringstekniker
- Hantering av minneslayout och buffertplacering
- Tekniker för att minska on-chip-minnesförbrukningen
- Bästa metoder för asynkron exekvering och återanvändning
Verksamhetsutveckling och fallstudier
- Fallstudie: prestandatuning av smarta städer med kameraförlopp
- Fallstudie: optimering av inferensstack för autonoma fordon
- Riktlinjer för iterativ profilering och kontinuerlig förbättring
Sammanfattning och nästa steg
Krav
- Solid kunskap om arkitektur och träningsarbetsflöden för djupinlärningsmodeller
- Erfarenhet av modeldistribution med CANN, TensorFlow eller PyTorch
- Förståelse för Linux CLI, shell-skript och Python-programmering
Målgrupp
- AI-prestandaingenjörer
- Inferensoptimeringsspecialister
- Utvecklare som arbetar med kant-AI eller realtidsystem
14 timmar