Kom i kontakt

Kursplan

Grundläggande principer för säkra och rättvisa AI:

  • Viktiga begrepp: säkerhet, bias, rättvisa, transparens
  • Slag av bias: datasetbias, representationsbias, algoritmbias
  • Översikt över regelverk (EU AI Act, GDPR, etc.)

Bias i finjusterade modeller

  • Hur finjustering kan introducera eller förstärka bias
  • Studier av fall och verkliga misslyckanden
  • Identifiering av bias i dataset och modellprediktioner

Metoder för att minska bias

  • Strategier på datanivå (ombalansering, dataaugmentation)
  • Strategier under träningen (regularisering, adversarial debiasing)
  • Strategier efter processeringen (utmatningsfiltrering, kalibrering)

Modellsäkerhet och robusthet

  • Detektera osäkra eller skadliga utmatningar
  • Hantering av adversariala indata
  • Red teaming och stress-testning av finjusterade modeller

Granskning och övervakning av AI-system

  • Mått för bias och rättvisa (t.ex. demografisk parity)
  • Verktøy för förklarbarhet och transparensramverk
  • Ständiga övervaknings- och styrningsmetoder

Verktygslådor och praktisk träning

  • Användning av open-source-bibliotek (t.ex. Fairlearn, Transformers, CheckList)
  • Praktiskt moment: Att detektera och minska bias i en finjusterad modell
  • Skapa säkra utmatningar genom prompt-design och begränsningar

Företagsfall och redskap för efterlevnad

  • Bästa praxis för att integrera säkerhet i LLM-arbetsflöden
  • Dokumentation och modellkort för efterlevnad
  • Förberedelser för revisioner och externa granskningar

Sammanfattning och nästa steg

Krav

  • Kunskap om maskininlärningsmodeller och träningsprocesser
  • Erfarenhet av arbete med finjustering och LLM:er
  • Van vid Python och NLP-koncept

Målgrupp

  • AI-kompetensansvariga team
  • ML-ingenjörer
 14 Timmar

Antal deltagare


Pris per deltagare

Kommande Kurser

Relaterade Kategorier