Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Kursplan
Introduktion till Reinforcement Learning
- Översikt över förstärkningsinlärning och dess tillämpningar
- Skillnader mellan övervakad, oövervakad och förstärkningsinlärning
- Nyckelbegrepp: handläggare, miljö, belöningar och princip
Markovs beslutsprocesser (MDP)
- Förstå tillstånd, åtgärder, belöningar och tillståndsövergångar
- Värdefunktioner och Bellmans ekvation
- Dynamisk programmering för att lösa MDP:er
Grundläggande RL-algoritmer
- Tabellmetoder: Q-Learning och SARSA
- Policybaserade metoder: FÖRSTÄRK-algoritmen
- Ramverk för aktör-kritiker och deras tillämpningar
Djup Reinforcement Learning
- Introduktion till Deep Q-Networks (DQN)
- Upplev uppspelning och målnätverk
- Principgradienter och avancerade djupa RL-metoder
RL-ramverk och verktyg
- Introduktion till OpenAI Gym och andra RL-miljöer
- Använda PyTorch eller TensorFlow för RL-modellutveckling
- Träning, testning och benchmarking av RL-agenter
Utmaningar i RL
- Balans mellan prospektering och exploatering i träning
- Hantering av glesa belöningar och problem med kredittilldelning
- ScalaAnvändbarhet och beräkningsmässiga utmaningar i RL
Praktiska övningar Activities
- Implementering av Q-Learning och SARSA-algoritmer från grunden
- Träna en DQN-baserad agent att spela ett enkelt spel i OpenAI Gym
- Finjustera RL-modeller för förbättrad prestanda i anpassade miljöer
Sammanfattning och nästa steg
Krav
- Stark förståelse för principer och algoritmer för maskininlärning
- Kunskaper i Python programmering
- Förtrogenhet med neurala nätverk och ramverk för djupinlärning
Publik
- Ingenjörer inom maskininlärning
- AI-specialister
14 timmar
Vittnesmål (1)
Tränare som svarar på frågor på plats.
Adrian
Kurs - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Machine Translated