Deep Reinforcement Learning (DRL) löst das Skalierbarkeitsproblem von Reinforcement Learning durch die Verwendung von Artificial Deep Neural Networks (DNN) als Repräsentation des gelernten Verhaltens. Bis heute ist DRL die stabilste und am meisten erforschte Problemformulierung des maschinellen Lernens für autonomes, durchgehendes und lebenslanges Lernen. Wegen des rechen- und speicherintensiven Designs sind die meisten DRL-Ansätze auf hochperformante Rechenarchitekturen angewiesen (wie z.B. high-end GPUs). Indem wir DRL als Lösungsmethode eines representativen Echtzeitproblems, des invertierten Pendels, verwenden, geben wir in dieser Arbeit eine Perspektive auf DRL in Bezug auf Speichereffizienz, Autonomie während der Lernphase und unvollständige Beobachtbarkeit der Umgebung (partial observability).
Building similarity graph...
Analyzing shared references across papers
Loading...
Hakim Tayari
TU Wien
Building similarity graph...
Analyzing shared references across papers
Loading...
Hakim Tayari (Sun,) studied this question.
www.synapsesocial.com/papers/69d895ea6c1944d70ce071ea — DOI: https://doi.org/10.34726/hss.2026.128166