Kursplan

Införandet

  • Lärande genom positiv förstärkning

Elements av Reinforcement Learning

Viktiga villkor (Åtgärder, Tillstånd, Belöningar, Policy, Värde, Q-Värde, etc.)

Översikt över metoder för tabelllösningar

Skapa en programvaruagent

Förstå värdebaserade, policybaserade och modellbaserade tillvägagångssätt

Att arbeta med Markovs beslutsprocess (MDP)

Hur principer definierar en agents sätt att bete sig

Använda Monte Carlo-metoder

Inlärning med temporala skillnader

n-steg Bootstrapping

Approximativa lösningsmetoder

Förutsägelse på principen med approximation

Kontroll på policy med approximation

Off-policy Metoder med approximation

Förstå berättigandespårningar

Använda metoder för principgradient

Sammanfattning och slutsats

Krav

  • Erfarenhet av maskininlärning
  • Programming Erfarenhet

Publik

  • Datavetare
 21 timmar

Antal deltagare


Price per participant

Upcoming Courses