AI Reinforcement Learning - eLearning
3.500,00 DKK
- 30 hours
Træd ind i fremtidens AI med kurset i Reinforcement Learning, hvor maskiner lærer ved at interagere, tilpasse sig og forbedre sig gennem erfaring. Dette kursus introducerer dig til en af de mest kraftfulde grene af maskinlæring, som bruges i robotteknologi, spil-AI, anbefalingssystemer og autonom beslutningstagning.
Nøglefunktioner
Sprog
Kursus og materiale på engelsk
Niveau
Begynder - Avanceret niveau
Adgang
1 års adgang til læringsplatformen
9 timers on-demand videoer
med over 30 timers anbefalet studietid
30 guidede praktiske øvelser
8 automatisk bedømte opgaver
46 huskequizzer
2 omfattende opgaver
Certifikat
Bevis for gennemført program medfølger
Læringsudbytte
Når du har gennemført dette kursus, vil du være i stand til at forstå:
Grundlæggende
Mestre grundlæggende principper i multi-agent reinforcement learning (RL)
Kerneparadigmer
Udforsk de tre grundlæggende paradigmer inden for maskinlæring
Balance
Forstå balancen mellem udforskning og udnyttelse
Tabular-Q
Lær tabulær Q-learning og Deep Q-learning metoder
RLib
Træn flere agenter med RLib
Markov
Få en forståelse af Markov-kæder og beslutningsprocesser

Kursusforløb
Introduktion til forstærkningslæring
Lektion 01
- Tre paradigmer inden for maskinlæring
- RL-succeshistorier
- Elementer i et RL-problem
- Introduktion til fitnesscenteret
- Træning af din første RL-agent med RLlib
Enkelttrins RL: Multiarmede banditter
Lektion 02
- Multi-armed bandit-opsætning
- Afvejningen mellem udforskning og udnyttelse
- Grundlæggende tilgange til at afveje udforskning og udnyttelse
- Avancerede tilgange til at afveje udforskning og udnyttelse
- Introduktion til kontekstuelle banditproblemer
- Et praktisk eksempel på kontekstuelle banditter
- Dybe kontekstuelle banditter
- Udforskning med dybe kontekstuelle banditter
- Et praktisk eksempel med dybe kontekstuelle banditter
Flertrins forstærkningslæring
Lektion 03
- Introduktion til Markov-kæder
- Markov-belønningsproces
- Markov-beslutningsproces
- Politikevaluering og -iteration
- Tabulær Q-læring
- Praktisk eksempel på tabellarisk Q-learning
- Deep Q-læring
- Brug af RLlib til at træne et Deep Q-netværk
- Politikbaserede metoder
- Brug af RLib til at træne en PPO‑agent
Tilgange til forstærkningslæring i virkeligheden
Lektion 04
- Håndtering af sparsomme belønninger og svær udforskning
- Implementér belønningsformning
- Ulemper ved belønningsformning
- Brug af hukommelse til at håndtere delvis observerbarhed
- Løsning af stateless Cartpole med LSTM
- At overvinde kløften mellem simulation og virkelighed
- Introduktion til multi-agent forstærkningslæring
- Træning af flere agenter med RLib
- Multi-agent forstærkningslæring
- Offline forstærkningslæring
- Konklusion og andre avancerede emner

Hvem bør tilmelde sig dette program?
Ambitiøse AI- og maskinlæringsingeniører
Datascientister, der ønsker at udvide til forstærkningslæring
Softwareudviklere med interesse for intelligente systemer og automatisering
Robotik- og spiludviklingsentusiaster
Studerende og fagfolk, der udforsker avancerede AI‑koncepter
Er der nogen, der er nysgerrige efter, hvordan AI lærer gennem forsøg og fejl
Forudsætninger
- Grundlæggende forståelse af Core Java-programmering
- Kendskab til objektorienterede programmeringskoncepter (OOP)
- Grundlæggende kendskab til brug af et IDE (f.eks. Eclipse eller Spring Tool Suite)
- En generel forståelse af, hvordan webapplikationer fungerer, er nyttig, men ikke påkrævet
Udtalelser
Licensering og akkreditering
Dette kursus tilbydes i henhold til Partnerprogramaftalen og overholder kravene i licensaftalen
Lighedspolitik
Kandidater opfordres til at kontakte AVC for vejledning og støtte gennem hele processen med tilpasning af arbejdsforhold.
Ofte stillede spørgsmål

Har du brug for virksomhedsløsninger eller LMS-integration?
Fandt du ikke kurset eller programmet, der ville være til gavn for din virksomhed? Har du brug for LMS-integration? Skriv til os, vi løser alt!
