Kursplan

Introduktion till förstärkning av inlärning

  • Översikt över förstärkning av inlärning och dess tillämpningar
  • Skillnader mellan övervakad, oövervakad och förstärkning av inlärning
  • Nyckelbegrepp: agent, miljö, belöningar och policy

Markov Decision Processes (MDPs)

  • Förståelse av tillstånd, åtgärder, belöningar och tillståndsövergångar
  • Värdefunktioner och Bellmans ekvation
  • Dynamisk programmering för lösning av MDPs

Kärn RL-algoritmer

  • Tabellmetoder: Q-Learning och SARSA
  • Policybaserade metoder: REINFORCE-algoritmen
  • Actor-Critic-ramverk och deras tillämpningar

Djup förstärkning av inlärning

  • Introduktion till Deep Q-Networks (DQN)
  • Erfarenhetsåterspelning och mål-nätverk
  • Policy-gradienter och avancerade djupa RL-metoder

RL-ramverk och verktyg

  • Introduktion till OpenAI Gym och andra RL-miljöer
  • Användning av PyTorch eller TensorFlow för utveckling av RL-modeller
  • Träning, testning och benchmarking av RL-agenter

Utmaningar inom RL

  • Balansering mellan utforskning och utnyttjande under träning
  • Hantering av knappa belöningar och kredittilldelningsproblem
  • Skalbarhet och beräkningsutmaningar inom RL

Hands-on-aktiviteter

  • Implementering av Q-Learning- och SARSA-algoritmer från grunden
  • Träning av en DQN-baserad agent för att spela ett enkelt spel i OpenAI Gym
  • Finjustering av RL-modeller för förbättrad prestanda i anpassade miljöer

Sammanfattning och nästa steg

Krav

  • Djup förståelse för maskininlärningsprinciper och algoritmer
  • Skicklighet i Python-programmering
  • Kännedom om neurala nätverk och djupinlärningsramverk

Målgrupp

  • Maskininlärningsingenjörer
  • AI-specialister
 14 timmar

Antal deltagare


Price per participant

Vittnesmål (1)

Upcoming Courses

Relaterade Kategorier