Kursplan

Avancerade Reinforcement Learning-tekniker

Distribuera Reinforcement Learning-modeller

Upplevelse och utnyttjande

Introduktion till Reinforcement Learning

Policybaserade metoder

Q-Learning och Deep Q-Networks (DQNs)

Sammanfattning och nästa steg

Arbeta med OpenAI Gym

  • Balansera upplevelse och utnyttjande i RL-modeller
  • Upplevelsestrategier: epsilon-greedy, softmax och mer
  • Introduktion till Q-learning
  • Implementera DQNs med TensorFlow
  • Optimerar Q-learning med erfarenhetsåterspels och målnätverk
  • Multi-agent förstärkninglärande
  • Deep deterministisk policygradient (DDPG)
  • Proximal policyoptimering (PPO)
  • Policygradientalgoritmer
  • REINFORCE-algoritm och dess implementering
  • Actor-critic-metoder
  • Praktiska tillämpningar av förstärkninglärande
  • Integrera RL-modeller i produktionsmiljöer
  • Använda miljöer i OpenAI Gym
  • Simulera agenter i dynamiska miljöer
  • Utvärdera agenter prestanda
  • Vad är förstärkninglärande?
  • Nyckelbegrepp: agent, miljö, tillstånd, åtgärder och belöningar
  • Utmaningar i förstärkninglärande

Krav

Målgrupp

  • Data scientists
  • Maskininlärningspraktiker
  • AI-forskare
  • Erfarenhet av Python programmering
  • Grundläggande förståelse för djupinlärning och maskininlärningskoncept
  • Kunskap om algoritmer och matematiska koncept som används inom förstärkningsinlärning
 28 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier