Kursplan

Grunder för ljudklassificering

  • Typer av ljudhändelser: miljömässig, mekanisk, mänskligt genererad
  • Översikt över användningsområden: övervakning, övervakning, automatisering
  • Ljudklassificering jämfört med detektion jämfört med segmentering

Ljuddata och funktionsutvinning

  • Typer av ljudfiler och format
  • Samplingsfrekvens, fönstering, överväganden av ramstorlek
  • Utvinning av MFCCs, kromafunktioner, mel-spektrogram

Förberedelse och annotering av data

  • UrbanSound8K, ESC-50 och anpassade datamängder
  • Markering av ljudhändelser och tidsgränser
  • Balansering av datamängder och ljudförstärkning

Byggande av ljudklassificeringsmodeller

  • Användning av konvolutiva neurala nätverk (CNNs) för ljud
  • Modellinmatning: rå vågform jämfört med funktioner
  • Förlustfunktioner, utvärderingsmått och överanpassning

Händelsedetektion och tidslokalisering

  • Rambaserad och segmentbaserad detektionsstrategi
  • Efterbearbetning av detektioner med trösklar och släthandling
  • Visualisering av förutsägelser på ljudtidslinjer

Avancerade ämnen och realtidsbehandling

  • Överföring av inlärning för lågdatascenarier
  • Distribuering av modeller med TensorFlow Lite eller ONNX
  • Strömmande ljudbehandling och latensöverväganden

Projektutveckling och applikationsscenarier

  • Design av en fullständig pipeline: inmatning till klassificering
  • Utveckling av en bevis-för-koncept för övervakning, kvalitetskontroll eller övervakning
  • Loggning, meddelande och integration med dashboards eller API:er

Sammanfattning och nästa steg

Krav

  • Förståelse för maskininlärningskoncept och modellträning
  • Erfarenhet av Python programmering och databearbetning
  • Kännedom om grunderna i digitalt ljud

Målgrupp

  • Data scientists
  • Maskininlärningsingenjörer
  • Forskare och utvecklare inom ljudsignalbehandling
 21 timmar

Antal deltagare


Pris per deltagare

Kommande Kurser

Relaterade Kategorier