February 26, 2024Open Access

時間的変分推論を用いた言語指導型スキル学習

Key Points

Key points are not available for this paper at this time.

Abstract

私たちは専門家のデモンストレーションからスキルを発見するアルゴリズムを提案します。本アルゴリズムはまず大規模言語モデル（LLMs）を利用して軌跡の初期分割を提案します。続いて、階層的変分推論フレームワークがLLMによって生成された分割情報を組み込み、軌跡セグメントの統合によって再利用可能なスキルを発見します。圧縮と再利用性のトレードオフをさらに制御するために、最小記述長原理に基づく新規補助目的を導入し、このスキル発見プロセスを導きます。結果として、この手法を搭載したエージェントは、BabyAI（グリッドワールドナビゲーション環境）とALFRED（家庭用シミュレーション環境）における新しい長期タスクで学習を加速し、基礎的スキル学習手法を上回るスキルを発見できることを示しました。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Haotian Fu

Pratyusha Sharma

Elias Stengel-Eskin

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

時間的変分推論を用いた言語指導型スキル学習

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider