Kursplan

Introduktion till kant-AI och Nano Banana

  • Huvudegenskaper hos kant-AI-arbetsbelastningar
  • Nano Bananas arkitektur och förmågor
  • Jämförelse mellan kant- och molndistribueringsstrategier

Förberedelse av modeller för kantdistribuering

  • Modellval och baslinjevärdering
  • Beroendehantering och kompatibilitetsöverväganden
  • Export av modeller för vidareoptimering

Modellkomprimeringsmetoder

  • Pruning-strategier och strukturell sparsamhet
  • Viktdelning och parameterreduktion
  • Utvärdering av komprimeringspåverkan

Kvantisering för kantprestanda

  • Post-träning kvantiseringstechniker
  • Kvantiseringsmedvetna träningsscenarier
  • INT8, FP16 och blandningsprecisionsmetoder

Accelerering med Nano Banana

  • Användning av Nano Bananas acceleratörer
  • Integrering av ONNX och hårdvarubackends
  • Prestandamätningar av accelerate inferens

Distribuering till kantenheter

  • Integrering av modeller i inbyggda eller mobila program
  • Körningskonfiguration och övervakning
  • Fel sökning vid distribueringsproblem

Prestandaprofilering och motstridighetsanalys

  • Latens, genomströmning och termiska begränsningar
  • Noggrannhets- vs prestandamotstridigheter
  • Iterativa optimeringsstrategier

Bästa praxis för underhåll av kant-AI-system

  • Versionering och kontinuerliga uppdateringar
  • Modellrollback och kompatibilitetsmanagement
  • Säkerhets- och integritetsöverväganden

Sammanfattning och nästa steg

Krav

  • Förståelse för maskininlärningsarbetsflöden
  • Erfarenhet av Pythonbaserad modellutveckling
  • Kännedom om neuronnätverksarkitekturer

Målgrupp

  • ML-ingetörer
  • Dataanalytiker
  • MLOps-praktiker
 14 timmar

Antal deltagare


Pris per deltagare

Vittnesmål (1)

Kommande Kurser

Relaterade Kategorier