Key points are not available for this paper at this time.
Wir stellen einen Reinforcement-Learning-Ansatz vor, der Deep Q-Networks verwendet, um ein Fahrzeug in einer 3D-Physiksimulation zu steuern. Allein anhand von Kamera-Bildeingaben lernt der Ansatz das Lenken des Fahrzeugs direkt in einem end-to-end Verfahren. Das System ist in der Lage, menschliches Fahrverhalten ohne die Notwendigkeit von gelabelten Trainingsdaten zu erlernen. Es wird eine auf Aktionen-basierende Belohnungsfunktion vorgeschlagen, die durch eine potenzielle Anwendung in realen Reinforcement-Learning-Szenarien motiviert ist. Im Vergleich zu einer naiven distanzbasierten Belohnungsfunktion verbessert sie das allgemeine Fahrverhalten des Fahrzeugagents. Der Agent erreicht sogar eine fahrzeugführerähnliche Leistung auf einer zuvor ungesehenen Strecke in unserer Simulationsumgebung.
Building similarity graph...
Analyzing shared references across papers
Loading...
Peter Wolf
Christian Hubschneider
Michael Weber
Karlsruhe Institute of Technology
FZI Research Center for Information Technology
Building similarity graph...
Analyzing shared references across papers
Loading...
Wolf et al. (Do,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/6a0a537e839f3dcd48b4edd5 — DOI: https://doi.org/10.1109/ivs.2017.7995727