Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Införandet
- Lärande genom positiv förstärkning
Elements av Reinforcement Learning
Viktiga villkor (åtgärder, tillstånd, belöningar, policy, värde, Q-värde, etc.)
Översikt över metoder för tabelllösningar
Skapa en programvaruagent
Förstå värdebaserade, policybaserade och modellbaserade tillvägagångssätt
Att arbeta med Markovs beslutsprocess (MDP)
Hur principer definierar en agents sätt att bete sig
Använda Monte Carlo-metoder
Temporal-Difference-inlärning
n-steg Bootstrapping
Approximativa lösningsmetoder
Förutsägelse på princip med approximation
Kontroll på policy med approximation
Off-policy Metoder med approximation
Förstå berättigandespårningar
Använda principgradientmetoder
Sammanfattning och slutsats
Krav
- Erfarenhet av maskininlärning
- Programming erfarenhet
Publik
- Dataforskare
21 timmar