Kursplan

Introduktion

Reinforcement Learning Grunderna

Grundläggande Reinforcement Learning tekniker

Introduktion till BURLAP

Konvergens av värde och policy iteration

Belöningsformning

Utforskning

Generalisering

Delvis observerbara MDP:er

alternativ

Logistik

TD Lambda

Policygradienter

Djup Q-Learning

Ämnen i spelteori

Sammanfattning och nästa steg

Krav

  • Kunskaper i Python
  • En förståelse för college Calculus och linjär algebra
  • Grundläggande förståelse för sannolikhet och Statistics
  • Erfarenhet av att skapa maskininlärningsmodeller i Python och Numpy

Publik

  • Utvecklare
  • Dataforskare
 21 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier