What question did this study set out to answer?

旨在开发一套连接语言模型与机器人系统的框架，实现多样环境中的有效任务规划。

May 9, 2026

从语言到行动：开放环境下自主机器人的分层多模态框架

Key Points

旨在开发一套连接语言模型与机器人系统的框架，实现多样环境中的有效任务规划。
提出了一个分层多模态LLMs-机器人框架，整合定位模块、规划模块和执行模块。
在三个真实场景中进行了广泛实验，包括消融研究。
评估了系统在拾取放置任务及需空间推理的长远任务中的表现。
该框架在拾取放置任务中表现出可靠性，成功优化基本操作执行。
在需要空间和几何推理的长远任务中观察到显著改进。
系统有效支持复杂环境中的自适应决策。

Abstract

传统的任务规划方法在多样化场景中通常缺乏泛化能力，而大型语言模型（LLMs）虽具备开放世界推理能力，却难以与物理环境和机器人系统对齐。为解决此限制，我们提出了一个分层多模态LLMs-机器人框架，整合了三个模块。定位模块将多模态输入映射为PDDL表示以提供上下文定位。规划模块利用基本库生成任务序列。执行模块在机器人平台上优化并执行基本操作。该框架还探讨了模糊指令在语言与机器人交互中的作用，利用多模态定位将自然语言与现实世界语境关联。涵盖三个真实场景的广泛实验，包括消融研究，验证了该框架的有效性。系统在拾取放置任务中展现出可靠性能，在要求空间及几何推理的长远任务中显著提升。结果表明该框架支持复杂环境中的自适应决策，有助于缩小LLMs、机器人系统与物理世界之间的差距。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Bo Zhang

Yahui Gan

Zhigang Wang

Journals

IET conference proceedings.

Actions

Institutions

Southeast University

Nantong University

State Council of the People's Republic of China

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

从语言到行动：开放环境下自主机器人的分层多模态框架

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider