May 29, 2024Open Access

RLeXplore: 内発的動機付け強化学習研究の加速化

Key Points

Key points are not available for this paper at this time.

Abstract

外発的報酬は特定のタスクにおいて強化学習（RL）エージェントを効果的に導くことができます。しかし、複雑な環境では、その設計と注釈に多大な人的労力を要するため、外発的報酬はしばしば不十分です。この制約は、補助的かつ密な信号を提供し、エージェントが教師なしで学習することを可能にする内発的報酬の必要性を強調しています。さまざまな内発的報酬の定式化が提案されているものの、それらの実装および最適化の詳細は十分に検討されておらず、標準化も欠如しているため、研究の進展が妨げられています。このギャップに対処するために、我々はRLeXploreを紹介します。これは統一された高度にモジュール化されたプラグアンドプレイのフレームワークであり、8つの最先端の内発的報酬アルゴリズムの信頼できる実装を提供します。さらに、我々は詳細な研究を行い、重要な実装の詳細を特定し、内発的動機付けRLにおける十分根拠のある標準的な実践を確立しました。RLeXploreのソースコードはhttps://github.com/RLE-Foundation/RLeXploreで利用可能です。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Mingqi Yuan

Roger Creus Castanyer

Bo Li

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

RLeXplore: 内発的動機付け強化学習研究の加速化

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider