Kursplan

Introduktion till Reinforcement Learning

  • Vad är förstärkningsinlärning?
  • Nyckelbegrepp: agent, miljö, tillstånd, åtgärder och belöningar
  • Utmaningar inom förstärkningsinlärning

Prospektering och utvinning

  • Balansera prospektering och utvinning i RL-modeller
  • Prospekteringsstrategier: epsilon-greedy, softmax med mera

Q-Learning och Deep Q-Networks (DQNs)

  • Introduktion till Q-learning
  • Implementera DQN:er med hjälp av TensorFlow
  • Optimera Q-learning med erfarenhetsreplay och målnätverk

Policybaserade metoder

  • Algoritmer för principgradient
  • FÖRSTÄRK-algoritmen och dess implementering
  • Skådespelar-kritiska metoder

Arbeta med OpenAI Gym

  • Ställa in miljöer i OpenAI Gym
  • Simulera agenter i dynamiska miljöer
  • Utvärdera agentens prestanda

Avancerade Reinforcement Learning tekniker

  • Förstärkningsinlärning med flera agenter
  • Djup deterministisk principgradient (DDPG)
  • Proximal principoptimering (PPO)

Distribuera Reinforcement Learning-modeller

  • Verkliga tillämpningar av förstärkningsinlärning
  • Integrera RL-modeller i produktionsmiljöer

Sammanfattning och nästa steg

Krav

  • Erfarenhet av Python programmering
  • Grundläggande förståelse för djupinlärning och maskininlärning
  • Kunskap om algoritmer och matematiska begrepp som används inom förstärkningsinlärning

Publik

  • Datavetare
  • Utövare av maskininlärning
  • AI-forskare
 28 timmar

Antal deltagare


Price per participant

Vittnesmål (4)

Upcoming Courses

Relaterade Kategorier