May 25, 2024Open Access

Diffusions-Belohnungs Gegnerschaftliches Imitationslernen

Key Points

Key points are not available for this paper at this time.

Abstract

Imitationslernen zielt darauf ab, eine Strategie zu erlernen, indem Experten-Demonstrationen beobachtet werden, ohne Zugang zu Belohnungssignalen aus der Umgebung zu haben. Generative adversarielle Imitationslernen (GAIL) formuliert Imitationslernen als gegnerisches Lernen, bei dem eine Generator-Strategie lernt, das Verhalten des Experten zu imitieren, und ein Diskriminator lernt, die Expertendemonstrationen von Agenten-Trajektorien zu unterscheiden. Trotz ermutigender Ergebnisse ist das Training von GAIL oft instabil und anfällig. Inspiriert von der jüngsten Dominanz von Diffusionsmodellen im generativen Modellieren schlägt diese Arbeit Diffusions-Belohnungs Gegnerschaftliches Imitationslernen (DRAIL) vor, das ein Diffusionsmodell in GAIL integriert, um präzisere und gleichmäßigere Belohnungen für das Strategielernen zu erzeugen. Konkret schlagen wir einen diffusionsbasierten diskriminativen Klassifikator vor, um einen verbesserten Diskriminator zu konstruieren; anschließend entwerfen wir Diffusionsbelohnungen basierend auf der Ausgabe des Klassifikators für das Strategielernen. Wir führen umfangreiche Experimente in Navigation, Manipulation und Fortbewegung durch und bestätigen die Wirksamkeit von DRAIL im Vergleich zu vorherigen Imitationslernmethode. Darüber hinaus zeigen zusätzliche experimentelle Ergebnisse die Generalisierbarkeit und Dateneffizienz von DRAIL. Visualisierte gelernte Belohnungsfunktionen von GAIL und DRAIL legen nahe, dass DRAIL präzisere und fließendere Belohnungen erzeugen kann.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Chun-Mao Lai

Hsiang-Chun Wang

Ping-Chun Hsieh

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Diffusions-Belohnungs Gegnerschaftliches Imitationslernen

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider