Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduktion
Reinforcement Learning Grunderna
Grundläggande Reinforcement Learning tekniker
Introduktion till BURLAP
Konvergens av värde och policy iteration
Belöningsformning
Utforskning
Generalisering
Delvis observerbara MDP:er
alternativ
Logistik
TD Lambda
Policygradienter
Djup Q-Learning
Ämnen i spelteori
Sammanfattning och nästa steg
Krav
- Kunskaper i Python
- En förståelse för college Calculus och linjär algebra
- Grundläggande förståelse för sannolikhet och Statistics
- Erfarenhet av att skapa maskininlärningsmodeller i Python och Numpy
Publik
- Utvecklare
- Dataforskare
21 timmar