Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Översikt över CANN optimeringsmöjligheter
- Hur inferensprestanda hanteras i CANN
- Optimeringsmål för AI-system på gränsen och inbyggda AI-system
- Förståelse för AI Core-utnyttjande och minnesallokering
- Introduktion till Graph Engine och körningspipeline
- Visualisering av operatörsgrafer och körningstidmetrik
- Ändring av beräkningsgrafer för optimering
- Användning av CANN Profileringverktyg (profilerare) för arbetsbelastningsanalys
- Analys av kernelkörningstid och flaskhalsar
- Minnesåtkomstprofilering och klickstrategier
- Översikt över TIK och operatörsprogrammeringsmodell
- Implementering av en anpassad operatör med TIK DSL
- Testning och prestationsmätning av operatör
- Introduktion till TVM-integrering med CANN
- Automatiseringstrategier för beräkningsgrafer
- När och hur man växlar mellan TVM och TIK
- Hantering av minneslayout och buffertplacering
- Tekniker för att minska on-chip minnesförbrukning
- Bästa praxis för asynkron körning och återanvändning
- Fallstudie: prestandjustering för smart city-kamerapipeline
- Fallstudie: optimering av självkörande bilars inferensstack
- Riktlinjer för iterativ profilering och kontinuerlig förbättring
Krav
- Starkt förståelse för djupinlärningsmodellsarkitekturer och träningsflöden
- Erfarenhet av modellimplementering med CANN, TensorFlow, eller PyTorch
- Kännedom om Linux CLI, shellsripting, och Python programmering
Målgrupp
- AI-prestandaingenjörer
- Specialister inom inferensoptimering
- Utvecklare som arbetar med edge AI eller realtidsystem
14 timmar