Kursplan

Införandet

  • Lärande genom positiv förstärkning

Elements av Reinforcement Learning

Viktiga villkor (åtgärder, tillstånd, belöningar, policy, värde, Q-värde, etc.)

Översikt över metoder för tabelllösningar

Skapa en programvaruagent

Förstå värdebaserade, policybaserade och modellbaserade tillvägagångssätt

Att arbeta med Markovs beslutsprocess (MDP)

Hur principer definierar en agents sätt att bete sig

Använda Monte Carlo-metoder

Temporal-Difference-inlärning

n-steg Bootstrapping

Approximativa lösningsmetoder

Förutsägelse på princip med approximation

Kontroll på policy med approximation

Off-policy Metoder med approximation

Förstå berättigandespårningar

Använda principgradientmetoder

Sammanfattning och slutsats

Krav

  • Erfarenhet av maskininlärning
  • Programming erfarenhet

Publik

  • Dataforskare
  21 timmar
 

Antal deltagare


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Relaterade Kurser

AI and Robotics for Nuclear - Extended

  120 timmar

AI and Robotics for Nuclear

  80 timmar

Relaterade Kategorier