論文の概要: Bimanual Robot Manipulation via Multi-Agent In-Context Learning
- arxiv url: http://arxiv.org/abs/2604.20348v1
- Date: Wed, 22 Apr 2026 08:51:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.04876
- Title: Bimanual Robot Manipulation via Multi-Agent In-Context Learning
- Title(参考訳): マルチエージェントインコンテキスト学習による双方向ロボット操作
- Authors: Alessio Palma, Indro Spinelli, Vignesh Prasad, Luca Scofano, Yufeng Jin, Georgia Chalvatzaki, Fabio Galasso,
- Abstract要約: BiCICLeは、標準のLLMが微調整なしで数ショットのバイマニュアル操作を実行できる最初のフレームワークである。
TWINベンチマークから13のタスクを評価すると、BiCICLeは平均成功率71.1%に達する。
- 参考スコア(独自算出の注目度): 19.589504654145326
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Language Models (LLMs) have emerged as powerful reasoning engines for embodied control. In particular, In-Context Learning (ICL) enables off-the-shelf, text-only LLMs to predict robot actions without any task-specific training while preserving their generalization capabilities. Applying ICL to bimanual manipulation remains challenging, as the high-dimensional joint action space and tight inter-arm coordination constraints rapidly overwhelm standard context windows. To address this, we introduce BiCICLe (Bimanual Coordinated In-Context Learning), the first framework that enables standard LLMs to perform few-shot bimanual manipulation without fine-tuning. BiCICLe frames bimanual control as a multi-agent leader-follower problem, decoupling the action space into sequential, conditioned single-arm predictions. This naturally extends to Arms' Debate, an iterative refinement process, and to the introduction of a third LLM-as-Judge to evaluate and select the most plausible coordinated trajectories. Evaluated on 13 tasks from the TWIN benchmark, BiCICLe achieves up to 71.1% average success rate, outperforming the best training-free baseline by 6.7 percentage points and surpassing most supervised methods. We further demonstrate strong few-shot generalization on novel tasks.
- Abstract(参考訳): 言語モデル(LLM)は、具体的制御のための強力な推論エンジンとして登場した。
特に、ICL(In-Context Learning)では、オフザシェルフでテキストのみのLLMが、その一般化能力を保ちながら、タスク固有のトレーニングをすることなく、ロボットの動作を予測することができる。
ICLを双方向操作に適用することは、高次元のジョイントアクション空間と厳密なアーム間調整制約が標準のコンテキストウィンドウを急速に超過しているため、依然として困難である。
そこで本研究では,標準LLMが微調整をせずに,数発のバイマナライズ操作を可能にする最初のフレームワークであるBiCICLe(Bimanual Coordinated In-Context Learning)を紹介する。
BiCICLeは、双方向制御をマルチエージェントのリーダ・フォロワー問題として捉え、アクション空間をシーケンシャルな条件付き単一アームの予測に分解する。
これは、反復的な洗練プロセスであるArms' Debateや、最も妥当な座標軌道の評価と選択のための第3のLSM-as-Judgeの導入にまで自然に拡張されている。
TWINベンチマークから13のタスクを評価すると、BiCICLeは71.1%の平均成功率に達し、最高のトレーニングなしベースラインを6.7ポイント上回り、最も監督された手法を上回っている。
新規なタスクについて、より強力な数ショットの一般化を実証する。
関連論文リスト
- Language-Grounded Decoupled Action Representation for Robotic Manipulation [78.42228162226839]
認識と制御を結びつけるために,Language-Grounded Decoupled Action Representation (LaDA) フレームワークを提案する。
LaDAは3つの解釈可能なアクションプリミティブ(翻訳、回転、グリップ制御)の微細な中間層を導入し、低レベルのアクションに対して明示的な意味構造を提供する。
さらに、セマンティックガイダンスによるソフトラベルのコントラスト学習の目的を用いて、類似のアクションプリミティブをタスク間で整列させ、一般化と動きの整合性を高める。
論文 参考訳(メタデータ) (2026-03-13T13:08:26Z) - RISER: Orchestrating Latent Reasoning Skills for Adaptive Activation Steering [62.63376387138257]
本稿では,アクティベーション空間における大規模言語モデル(LLM)推論を適応的に制御するプラグイン・アンド・プレイ介入フレームワークを提案する。
RISERは再利用可能な推論ベクトルのライブラリを構築し、軽量ルータを使用して各入力に対して動的に構成する。
ルーターは、タスクレベルの報酬の下で強化学習を通じて最適化され、緊急かつ構成的な方法で潜在する認知的プリミティブを活性化する。
論文 参考訳(メタデータ) (2026-01-14T08:04:33Z) - Plan Verification for LLM-Based Embodied Task Completion Agents [10.439882851477162]
大規模言語モデル(LLM)に基づくタスク計画とそれに対応するAIの人間による実演は騒々しいかもしれない。
審査員が行動系列を批判し、プランナーLLMが修正を適用する反復検証フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-02T19:06:56Z) - Rethinking Bimanual Robotic Manipulation: Learning with Decoupled Interaction Framework [51.39847596489193]
バイオマチックなロボット操作は、ロボティクスコミュニティにおいて、新しくて重要なトピックである。
本稿では,バイマニュアル操作における異なるタスクの特徴を考察した,疎結合なインタラクションフレームワークを提案する。
我々のフレームワークは,SOTA法よりも23.5%向上し,優れた性能を実現している。
論文 参考訳(メタデータ) (2025-03-12T09:28:41Z) - TL-Training: A Task-Feature-Based Framework for Training Large Language Models in Tool Use [72.32614703504122]
大規模言語モデル(LLM)は、環境と対話するツールを活用することで、目覚ましい進歩を遂げる。
大規模なデータセットに依存する標準教師付き微調整アプローチでは、ツール使用時のタスク固有の特性を見落としていることが多い。
本稿では,最適下トレーニングデータの効果を緩和するタスク機能ベースのフレームワークであるTL-Trainingを提案する。
論文 参考訳(メタデータ) (2024-12-20T02:21:36Z) - BiKC: Keypose-Conditioned Consistency Policy for Bimanual Robotic Manipulation [48.08416841005715]
両面操作に適したキーポーズ条件の整合性ポリシーを導入する。
階層的な模倣学習フレームワークであり、ハイレベルなキープレース予測器と低レベルな軌道生成器から構成される。
シミュレーションおよび実世界の実験結果から,提案手法は成功率と運用効率の点で基準法を超越していることが示された。
論文 参考訳(メタデータ) (2024-06-14T14:49:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。