論文の概要: Learning to Assist: Collaborative VLAs for Implicit Human-Robot Collaboration
- arxiv url: http://arxiv.org/abs/2606.12475v1
- Date: Wed, 10 Jun 2026 05:42:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.35014
- Title: Learning to Assist: Collaborative VLAs for Implicit Human-Robot Collaboration
- Title(参考訳): 支援を学ぶ:人間とロボットの協力を欠くためのコラボレーション型VLA
- Authors: Leo Xu, Letian Li, Alex Cuellar, Michael Hagenow,
- Abstract要約: 我々は、模倣学習、特に視覚言語アクション(VLA)モデルで訓練されたエンドツーエンドモデルが協調的な操作をサポートすることを示す。
政策性能を保ちながら誤った補助行動を軽減するための推論時ステアリング手法を提案する。
- 参考スコア(独自算出の注目度): 0.9519647470165689
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human-robot collaboration (HRC) combines the complementary strengths of humans and robots to improve task efficiency. However, many existing collaborative systems rely on hand-engineered pipelines, limiting their scalability and flexibility for new tasks. In this work, we show that models trained end-to-end with imitation learning, specifically vision-language-action (VLA) models, can support collaborative manipulation, and characterize the key factors affecting their real-world performance. We evaluate two state-of-the-art models and identify a failure mode of action-chunking policies in implicit HRC, where demonstration action leakage (i.e., action chunks crossing latent task transitions) can cause premature assistive behavior. We find that this issue increases with longer execution horizons and occurs in real-world collaborative VLA systems, such as when a robot attempts to hand over a tool before the person is ready. We propose an inference-time steering method to mitigate these erroneous assistive actions while preserving policy performance. Finally, through a 16-participant user study on a long-horizon collaborative assembly task, we show that steering enables a longer execution horizon while mitigating premature assistance, leading to faster collaboration and fewer failures compared to a shorter-horizon policy.
- Abstract(参考訳): ヒューマンロボットコラボレーション(HRC)は、人間とロボットの相補的な強みを組み合わせてタスク効率を向上させる。
しかし、既存の多くのコラボレーティブシステムは手動パイプラインに依存しており、新しいタスクのスケーラビリティと柔軟性を制限している。
本研究では,模倣学習,特に視覚言語アクション(VLA)モデルを用いて訓練されたエンドツーエンドモデルが協調操作をサポートし,実世界のパフォーマンスに影響を及ぼす重要な要因を特徴づけることができることを示す。
我々は2つの最先端モデルを評価し、暗黙的なHRCにおけるアクションチャンキングポリシーの失敗モードを特定し、デモアクションリーク(遅延タスク遷移を横断するアクションチャンク)が早期に補助行動を引き起こす可能性がある。
この問題は、より長い実行地平線で増加し、ロボットが準備が整う前にツールを渡そうとするなど、現実の協調的なVLAシステムで発生する。
政策性能を保ちながら、これらの誤った補助行動を軽減するための推論時ステアリング手法を提案する。
最後に, 長期共同作業における16名のユーザスタディを通じて, ステアリングは早期支援を緩和しつつ, より長い実行地平線を実現できることを示す。
関連論文リスト
- Assistance Without Interruption: A Benchmark and LLM-based Framework for Non-Intrusive Human-Robot Assistance [44.10105182063131]
我々は、人間-ロボット相互作用(HRI)の独立したパラダイムとして、非侵入支援を形式化し、ベンチマークする。
直接命令や明示的な交渉,あるいはユーザの習慣や履歴に基づく積極的な介入に依存する従来のHRIタスクとは違って,我々のタスクは人間の計画を主要なプロセスとして扱い,いつ,何をすべきかという共同決定として支援を定式化する。
NIABenchと実世界のシナリオの総合的な実験により,本手法は作業効率を保ちながら人的労力を減らし,積極的かつ非侵襲的な支援を実現することを示す。
論文 参考訳(メタデータ) (2026-05-02T10:25:40Z) - Long-Term Memory for VLA-based Agents in Open-World Task Execution [12.869726287795693]
VLA(Vision-Language-Action)モデルは、具体的意思決定に重要な可能性を示している。
既存のフレームワークは、計画と実行を分離されたプロセスとして扱う。
ChemBotは、自律的なAIエージェントと、階層的なタスクの分解と実行のための進捗対応VLAモデルを統合する。
論文 参考訳(メタデータ) (2026-04-17T03:49:41Z) - Human-Robot Copilot for Data-Efficient Imitation Learning [38.76308745375941]
遠隔操作による人間の実演を収集し,ロボットにタスク固有のスキルを教える枠組みを提案する。
Human-Robot Copilotフレームワークは、広範囲の産業用および研究用マニピュレータとの互換性を維持しながら、デクスタラス遠隔操作のスケーリングファクタを利用することができる。
論文 参考訳(メタデータ) (2026-04-04T07:00:32Z) - RoboClaw: An Agentic Framework for Scalable Long-Horizon Robotic Tasks [28.827331437876452]
データ収集、ポリシー学習、タスク実行を単一のVLM駆動コントローラで統合するエージェントロボットフレームワークであるRoboClawを提案する。
ポリシーレベルでは、RoboClaw氏はEntangled Action Pairs(EAP)を紹介している。
デプロイ中、同じエージェントが高レベルの推論を行い、学習されたポリシープリミティブを動的にオーケストレーションして長期のタスクを遂行する。
論文 参考訳(メタデータ) (2026-03-12T05:22:59Z) - Towards Human-Like Manipulation through RL-Augmented Teleoperation and Mixture-of-Dexterous-Experts VLA [62.16042475700567]
本稿では,遠隔操作データ収集を簡易化する共有自律型アシスタントIMCopilotを紹介する。
我々は、不均一な力と触覚モーダルを予め訓練されたVLAバックボーンにシームレスに統合するアーキテクチャであるMoDE-VLAを提案する。
我々は,複雑度を増大させる4つの課題に対するアプローチの有効性を検証し,厳密な接触量の多い課題におけるベースラインよりも2倍の成功率の向上を実証した。
論文 参考訳(メタデータ) (2026-03-09T09:02:30Z) - Multi-agent cooperation through learning-aware policy gradients [53.63948041506278]
利己的な個人はしばしば協力に失敗し、マルチエージェント学習の根本的な課題を提起する。
本稿では,学習型強化学習のための,偏見のない高導出性ポリシー勾配アルゴリズムを提案する。
我々は, 受刑者のジレンマから, 自己関心のある学習エージェントの間でどのように, いつ, 協力関係が生じるかの新たな説明を得た。
論文 参考訳(メタデータ) (2024-10-24T10:48:42Z) - Large Language Model-based Human-Agent Collaboration for Complex Task
Solving [94.3914058341565]
複雑なタスク解決のためのLarge Language Models(LLM)に基づくヒューマンエージェントコラボレーションの問題を紹介する。
Reinforcement Learning-based Human-Agent Collaboration method, ReHACを提案する。
このアプローチには、タスク解決プロセスにおける人間の介入の最も急進的な段階を決定するために設計されたポリシーモデルが含まれている。
論文 参考訳(メタデータ) (2024-02-20T11:03:36Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。