Kursplan

Grunder för säker och rättvis AI

  • Nyckelbegrepp: säkerhet, bias, rättvisa, transparens
  • Typer av bias: dataset, representation, algoritmisk
  • Översikt över regelverk (EU AI-lagen, GDPR etc.)

Bias i finjusterade modeller

  • Hur finjustering kan introducera eller förstärka bias
  • Fallstudier och misslyckanden i verkliga världen
  • Identifiera bias i dataset och modellprediktioner

Tekniker för biasmitigering

  • Strategier på datanivå (återbalansering, förstärkning)
  • Strategier under träning (regulering, adversariell debiasing)
  • Strategier efter bearbetning (utdatafiltrering, kalibrering)

Modellsäkerhet och robusthet

  • Detektera osäkra eller skadliga utsignaler
  • Hantera adversariella inmatningar
  • Red teaming och stressprovning av finjusterade modeller

Auditering och övervakning av AI-system

  • Bias- och rättvisaevaleringsmått (t.ex. demografisk paritet)
  • Förklaringsverktyg och transparensramverk
  • Ongoing övervakning och styrningspraxis

Verktygslådor och praktisk övning

  • Användning av öppen källkod bibliotek (t.ex., Fairlearn, Transformers, CheckList)
  • Hands-on: Detektera och mitigera bias i en finjusterad modell
  • Generera säkra utsignaler genom promptdesign och begränsningar

Företagsanvändningsfall och beredskap för efterlevnad

  • Bästa praxis för att integrera säkerhet i LLM-arbetsflöden
  • Dokumentation och modellkort för efterlevnad
  • Förbereda för auditering och externa granskningar

Sammanfattning och nästa steg

Krav

  • Förståelse för maskininlärningsmodeller och träningsprocesser
  • Erfarenhet av att arbeta med finjustering och LLMs
  • Kännedom om Python och NLP-koncept

Målgrupp

  • AI-konformitetsteam
  • ML-ingenjörer
 14 timmar

Antal deltagare


Pris per deltagare

Kommande Kurser

Relaterade Kategorier