Kursplan

Introduktion till utveckling av anpassade operatörer

  • Varför bygga anpassade operatörer? Användningsfall och begränsningar
  • CANN körstrukturen och integrationspunkter för operatörer
  • Översikt över TBE, TIK och TVM i Huaweis AI-ekosystem

Användning av TIK för låg nivå operatörer Programming

  • Förståelse för TIK-programmeringsmodellen och stödda API:er
  • Minnehantering och klistringsstrategi i TIK
  • Skapande, kompilering och registrering av en anpassad operatör med CANN

Testning och validering av anpassade operatörer

  • Enhets- och integreringstestning av operatörer i grafen
  • Felsökning av prestandaproblem på kärnelnivå
  • Visualisering av operatörsutförande och buffertbeteende

TVM-baserad schemaläggning och optimering

  • Översikt över TVM som kompilator för tensoroperatörer
  • Skrivning av ett schema för en anpassad operatör i TVM
  • TVM-justering, bänkning och kodgenerering för Ascend

Integration med ramverk och modeller

  • Registrering av anpassade operatörer för MindSpore och ONNX
  • Verifiering av modellintegritet och återfallsbeteende
  • Stöd för grafer med flera operatörer och blandad precision

Case Studies och specialiserade optimeringar

  • Fallstudie: hög effektiv konvolution för små inmatningsformer
  • Fallstudie: minnesmedveten uppmärksammande operatörsoptimering
  • Bäst praxis vid anpassad operatörsinstallation över enheter

Sammanfattning och nästa steg

Krav

  • Djupt förståelse av AI-modellens inre delar och operatornivåberäkningar
  • Erfarenhet av Python och Linux utvecklingsmiljöer
  • Kännedom om neurala nätverkskompilatorer eller grafoptimeringar på operatörsnivå

Målgrupp

  • Kompilatoringenjörer som arbetar med AI-verktygskedjor
  • Systemutvecklare som fokuserar på låg nivå AI-optimering
  • Utvecklare som bygger anpassade operatörer eller riktar in sig på nya AI-arbetsbelastningar
 14 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier