論文の概要: Learning Multi-Modal Trajectory Policies for Data-Efficient Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2606.01047v1
- Date: Sun, 31 May 2026 06:35:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.170054
- Title: Learning Multi-Modal Trajectory Policies for Data-Efficient Robotic Manipulation
- Title(参考訳): データ効率の良いロボットマニピュレーションのための多モード軌道論の学習
- Authors: Zijia Chen, Yuenan Hou, Xinhua Jiang, Yu Li, Weijie Li, Li Liu,
- Abstract要約: MATE (Multi-Modal MoE) は、MoE上に構築された新しい軌道予測フレームワークである。
細粒度サブモーダルコサインを実現するためのマルチモーダルMOEアーキテクチャを導入し、安定かつスケール不変なエキスパートアサインのためのクロスモーダルルータを設計する。
ロボットピンポンの実験では、私たちのMATEはデータ不足下での作業よりもずっと優れています。
- 参考スコア(独自算出の注目度): 21.99077052779724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic manipulation requires the effective integration of heterogeneous inputs, including visual observations, language instructions, and trajectory representations, to generate accurate actions. Existing transformer-based policies typically process these heterogeneous modalities within a shared parameter space, which often leads to modality interference and inefficient representation learning, especially in data-scarce scenarios. While Mixture-of-Experts (MoE) offers a scalable solution through expert specialization, conventional routing mechanisms are often sensitive to such cross-modal representation discrepancies, resulting in unstable expert assignment and expert collapse. In this work, we propose MATE (Multi-ModAl TrajEctory Policies), a novel trajectory prediction framework built upon MoE. Specifically, we introduce a Multi-Modal MoE architecture to achieve fine-grained sub-token feature decoupling, and design a cross-modal cosine router for stable and scale-invariant expert assignment across heterogeneous modalities. We further employ temperature-controlled routing and stochastic noise injection to improve expert balance and prevent premature routing collapse under scarce demonstrations. Experiments on the LIBERO benchmark show that our MATE consistently outperforms prior work under data scarcity. It achieves a 4.75% improvement in average success rate over the trajectory-guided counterpart. Real-world experiments on robotic ping-pong also suggest that the predicted trajectories can provide useful guidance for downstream robotic execution, further indicating the practical feasibility of our algorithm.
- Abstract(参考訳): ロボット操作では、正確な動作を生成するために、視覚観察、言語指示、軌跡表現を含む異種入力を効果的に統合する必要がある。
既存のトランスフォーマーベースのポリシーは、通常、共有パラメータ空間内でこれらの不均一なモダリティを処理し、特にデータ共有シナリオにおいて、モダリティの干渉や非効率な表現学習につながる。
Mixture-of-Experts (MoE) は、専門家の専門化を通じてスケーラブルなソリューションを提供するが、従来のルーティングメカニズムは、しばしばそのようなモダル表現の相違に敏感であり、不安定な専門家の割り当てと専門家の崩壊をもたらす。
本稿では,MATE(Multi-ModAl TrajEctory Policies)を提案する。
具体的には,マルチモーダルMOEアーキテクチャを導入し,細粒度のサブトーケン機能デカップリングを実現し,不均一なモーダルをまたいだ安定かつスケール不変なエキスパートアサインのためのクロスモーダルコサインルータを設計する。
さらに、温度制御されたルーティングと確率的ノイズ注入を用いて、専門家のバランスを改善し、希少な実演下での早期のルーティング崩壊を防止する。
LIBEROベンチマークの実験では、私たちのMATEはデータの不足下での以前の作業よりも一貫して優れています。
軌道誘導式よりも平均成功率を4.75%向上させる。
実世界のロボットピンポン実験では、予測された軌道が下流でのロボット実行に役立つことが示唆され、さらにアルゴリズムの実用性も示唆された。
関連論文リスト
- Semantically Structured Mixture-of-Experts for Compositional Robotic Manipulation [21.358519910897652]
拡散ベースのポリシーは、正確なロボット操作のための新しい標準を確立したが、重要なスケーラビリティのボトルネックに直面している。
合成ロボット操作のためのSMODP(Semantically Structured Mixture-of-Experts Diffusion Policy)を導入する。
提案手法は,パラメータ効率が大幅に向上したマルチタスクベンチマークにおいて,代表拡散とMoEベースのベースラインよりも優れていた。
論文 参考訳(メタデータ) (2026-05-22T10:38:59Z) - Adaptor: Advancing Assistive Teleoperation with Few-Shot Learning and Cross-Operator Generalization [26.90003783245582]
Adaptorは、堅牢なクロスオペレーターインテント認識のためのフレームワークである。
ドメインギャップを、前処理とポリシー学習という2つの段階にブリッジする。
最先端のパフォーマンスを実現し、成功率とベースラインよりも効率を向上します。
論文 参考訳(メタデータ) (2026-04-10T16:19:43Z) - Robometer: Scaling General-Purpose Robotic Reward Models via Trajectory Comparisons [69.87766750714945]
汎用ロボット報酬モデルは通常、専門家によるデモンストレーションから絶対的なタスク進捗を予測するために訓練される。
本稿では、軌道内進行監視と軌道間優先監視を組み合わせたスケーラブルな報酬モデリングフレームワークRobometerを紹介する。
ロビオメーターは、専門家データに報酬等級を固定するフレームレベルのプログレス・ロスと、グローバルな順序制約を課す軌跡比較優先損失という2つの目的で訓練されている。
論文 参考訳(メタデータ) (2026-03-02T17:38:58Z) - Guided Verifier: Collaborative Multimodal Reasoning via Dynamic Process Supervision [11.159231524113764]
マルチモーダル大規模言語モデル(MLLM)の複雑な推論能力を高めるための重要なメカニズムとして強化学習(RL)が登場した。
本稿では,これらの構造的制約に対処する textbfGuided Verifier フレームワークを提案する。
我々は,マルチモーダル幻覚をターゲットとした特殊なデータ合成パイプラインを開発し,プロセスレベルの負の textbfCoRe データセットとtextbfCorrect-guide textbfReasoning トラジェクトリを構築し,ガイド付き検証器を訓練する。
論文 参考訳(メタデータ) (2026-02-04T07:38:42Z) - Single Domain Generalization with Model-aware Parametric Batch-wise Mixup [22.709796153794507]
単一ドメインの一般化は、マシンラーニングの分野において、依然として深刻な課題である。
本稿では,モデル認識型パラメトリックバッチ・ワイド・ミックスアップ(Parametric Batch-wise Mixup)と呼ばれる新しいデータ拡張手法を提案する。
機能間相関を利用することで、パラメータ化されたミックスアップジェネレータは、複数のインスタンスにまたがる機能の組み合わせにおいて、さらなる汎用性を導入する。
論文 参考訳(メタデータ) (2025-02-22T03:45:18Z) - Conditional Neural Expert Processes for Learning Movement Primitives from Demonstration [1.9336815376402723]
条件付きニューラルネットワークプロセス(CNEP)は、異なるモードから異なる専門家ネットワークにデモを割り当てることを学ぶ。
CNEPは、軌道がどのモードに属するかの監督を必要としない。
本システムは,オンラインコンディショニング機構を用いて,環境変化へのオンザフライ適応が可能なシステムである。
論文 参考訳(メタデータ) (2024-02-13T12:52:02Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。