Kursplan

Införandet

  • Lärande genom positiv förstärkning

Elements av Reinforcement Learning

Viktiga villkor (åtgärder, tillstånd, belöningar, policy, värde, Q-värde, etc.)

Översikt över metoder för tabelllösningar

Skapa en programvaruagent

Förstå värdebaserade, policybaserade och modellbaserade tillvägagångssätt

Att arbeta med Markovs beslutsprocess (MDP)

Hur principer definierar en agents sätt att bete sig

Använda Monte Carlo-metoder

Temporal-Difference-inlärning

n-steg Bootstrapping

Approximativa lösningsmetoder

Förutsägelse på princip med approximation

Kontroll på policy med approximation

Off-policy Metoder med approximation

Förstå berättigandespårningar

Använda principgradientmetoder

Sammanfattning och slutsats

Krav

  • Erfarenhet av maskininlärning
  • Programming erfarenhet

Publik

  • Dataforskare
 21 timmar

Antal deltagare



Price per participant

Relaterade Kurser

AI and Robotics for Nuclear - Extended

120 timmar

AI and Robotics for Nuclear

80 timmar

Relaterade Kategorier