May 2, 2024

拡散モデルを用いたシーン生成のためのユーザー指導型フレームワーク

Key Points

Key points are not available for this paper at this time.

Abstract

近年、ロボティクスの一分野では、操作、知覚、ナビゲーションといった特定の人間の能力を模倣し、日常のタスクを達成することに焦点を当ててきました。しかし、これらの従来の能力を超え、人間がタスクを解決する方法には、想像力のようなより複雑な能力も含まれており、これによりシナリオを予測することが可能です。本研究では、大規模拡散モデルを活用してロボットに想像力を実装するために設計された新規アーキテクチャを紹介します。提案されたフレームワークは、認知段階、解決策生成段階、そして最終段階の選択アルゴリズムで構成されています。このアーキテクチャにより、ロボットは与えられた入力情報に応じて文脈の有無にかかわらず新たな状況を想像できる推論能力を獲得します。性能と実行時間の最適な関係を達成するために、異なる拡散モデルをゼロショット構成で体系的に評価しました。また、本手法の精度とユーザーの利便性を検証するためのテストも実施しました。これらは、物体の再配置、夕食用のテーブル設定、乱雑なデスクトップの整理など様々なシーンや異なる応用に対して行われました。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Alberto Méndez

Adrián Prados

Noelia Fernandez

Actions

Institutions

Universidad Carlos III de Madrid

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

拡散モデルを用いたシーン生成のためのユーザー指導型フレームワーク

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider