Key points are not available for this paper at this time.
私たちは専門家のデモンストレーションからスキルを発見するアルゴリズムを提案します。本アルゴリズムはまず大規模言語モデル(LLMs)を利用して軌跡の初期分割を提案します。続いて、階層的変分推論フレームワークがLLMによって生成された分割情報を組み込み、軌跡セグメントの統合によって再利用可能なスキルを発見します。圧縮と再利用性のトレードオフをさらに制御するために、最小記述長原理に基づく新規補助目的を導入し、このスキル発見プロセスを導きます。結果として、この手法を搭載したエージェントは、BabyAI(グリッドワールドナビゲーション環境)とALFRED(家庭用シミュレーション環境)における新しい長期タスクで学習を加速し、基礎的スキル学習手法を上回るスキルを発見できることを示しました。
Building similarity graph...
Analyzing shared references across papers
Loading...
Haotian Fu
Pratyusha Sharma
Elias Stengel-Eskin
Building similarity graph...
Analyzing shared references across papers
Loading...
Fu ら(Mon,)はこの問題を研究しました。
www.synapsesocial.com/papers/68e779e4b6db6435876ee831 — DOI: https://doi.org/10.48550/arxiv.2402.16354
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: