Kursplan

Introduktion

Reinforcement Learning Grunderna

Grundläggande Reinforcement Learning tekniker

Introduktion till BURLAP

Konvergens av värde och policy iteration

Belöningsformning

Utforskning

Generalisering

Delvis observerbara MDP:er

alternativ

Logistik

TD Lambda

Policygradienter

Djup Q-Learning

Ämnen i spelteori

Sammanfattning och nästa steg

Krav

  • Kunskaper i Python
  • En förståelse för college Calculus och linjär algebra
  • Grundläggande förståelse för sannolikhet och Statistics
  • Erfarenhet av att skapa maskininlärningsmodeller i Python och Numpy

Publik

  • Utvecklare
  • Dataforskare
  21 timmar
 

Antal deltagare


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Relaterade Kurser

Relaterade Kategorier