What type of study is this?

This is a Experimental Study study.

October 8, 2025Open Access

VLA-Touch：二重レベルの触覚フィードバックによる視覚・言語・行動モデルの強化

Key Points

触覚フィードバックの統合により、ロボット工学におけるタスク計画の効率と実行精度が向上します。
VLA-Touchは事前学習済み触覚・言語モデルに依存し、ロボットのタスク計画を強化します。
拡散ベースのコントローラを利用することで、VLA-Touchは触覚信号でVLA生成アクションを洗練します。
本手法は、VLAモデルに触覚信号を取り込むための大規模マルチモーダルデータセット不足の問題に対処しています。

Abstract

触覚フィードバックは物理世界との効果的な相互作用に不可欠であると一般的に認識されています。しかし、最先端の視覚・言語・行動（VLA）モデルは触覚信号の解釈および利用能力を欠いており、接触が重要なタスクでの効果が制限されています。これらのシステムに触覚フィードバックを組み込むことは、大規模なマルチモーダルデータセットが存在しないため困難です。私たちは、基本のVLAを微調整せずに触覚センサーを用いてジェネラリストロボットポリシーを強化する方法であるVLA-Touchを提案します。本手法は二つの主要な革新をもちます：（1）高レベルのタスク計画のために意味的な触覚フィードバックを提供する事前学習済み触覚・言語モデルを活用するパイプライン、（2）接触の多い操作のために触覚信号でVLA生成アクションを洗練する拡散ベースのコントローラ。実世界実験を通じて、触覚フィードバックの二重レベル統合がタスク計画効率を向上させつつ実行精度を高めることを実証しました。コードはhttps://github.com/jxbi1010/VLA-Touchにてオープンソースです。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jianxin Bi

Kevin Ma

Ce Hao

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

VLA-Touch：二重レベルの触覚フィードバックによる視覚・言語・行動モデルの強化

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider