Kursplan

Introduktion till Reinforcement Learning

  • Översikt över förstärkningsinlärning och dess tillämpningar
  • Skillnader mellan övervakad, oövervakad och förstärkningsinlärning
  • Nyckelbegrepp: handläggare, miljö, belöningar och princip

Markovs beslutsprocesser (MDP)

  • Förstå tillstånd, åtgärder, belöningar och tillståndsövergångar
  • Värdefunktioner och Bellmans ekvation
  • Dynamisk programmering för att lösa MDP:er

Grundläggande RL-algoritmer

  • Tabellmetoder: Q-Learning och SARSA
  • Policybaserade metoder: FÖRSTÄRK-algoritmen
  • Ramverk för aktör-kritiker och deras tillämpningar

Djup Reinforcement Learning

  • Introduktion till Deep Q-Networks (DQN)
  • Upplev uppspelning och målnätverk
  • Principgradienter och avancerade djupa RL-metoder

RL-ramverk och verktyg

  • Introduktion till OpenAI Gym och andra RL-miljöer
  • Använda PyTorch eller TensorFlow för RL-modellutveckling
  • Träning, testning och benchmarking av RL-agenter

Utmaningar i RL

  • Balans mellan prospektering och exploatering i träning
  • Hantering av glesa belöningar och problem med kredittilldelning
  • ScalaAnvändbarhet och beräkningsmässiga utmaningar i RL

Praktiska övningar Activities

  • Implementering av Q-Learning och SARSA-algoritmer från grunden
  • Träna en DQN-baserad agent att spela ett enkelt spel i OpenAI Gym
  • Finjustera RL-modeller för förbättrad prestanda i anpassade miljöer

Sammanfattning och nästa steg

Krav

  • Stark förståelse för principer och algoritmer för maskininlärning
  • Kunskaper i Python programmering
  • Förtrogenhet med neurala nätverk och ramverk för djupinlärning

Publik

  • Ingenjörer inom maskininlärning
  • AI-specialister
 14 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier