Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Införandet
- Lärande genom positiv förstärkning
Elements av Reinforcement Learning
Viktiga villkor (Åtgärder, Tillstånd, Belöningar, Policy, Värde, Q-Värde, etc.)
Översikt över metoder för tabelllösningar
Skapa en programvaruagent
Förstå värdebaserade, policybaserade och modellbaserade tillvägagångssätt
Att arbeta med Markovs beslutsprocess (MDP)
Hur principer definierar en agents sätt att bete sig
Använda Monte Carlo-metoder
Inlärning med temporala skillnader
n-steg Bootstrapping
Approximativa lösningsmetoder
Förutsägelse på principen med approximation
Kontroll på policy med approximation
Off-policy Metoder med approximation
Förstå berättigandespårningar
Använda metoder för principgradient
Sammanfattning och slutsats
Krav
- Erfarenhet av maskininlärning
- Programming Erfarenhet
Publik
- Datavetare
21 timmar