論文の概要: Morphologically Equivariant Flow Matching for Bimanual Mobile Manipulation
- arxiv url: http://arxiv.org/abs/2605.12228v1
- Date: Tue, 12 May 2026 15:04:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.945982
- Title: Morphologically Equivariant Flow Matching for Bimanual Mobile Manipulation
- Title(参考訳): 双方向移動マニピュレーションのための形態的同変フローマッチング
- Authors: Max Siebenborn, Daniel Ordoñez Apraez, Sophie Lueth, Giulio Turrisi, Massimiliano Pontil, Claudio Semini, Georgia Chalvatzaki,
- Abstract要約: 形態的対称性は 未発見だが重要な帰納的バイアスだ 双方向の移動操作の学習に
ある構成におけるタスクの解決方法を知ることで、ミラー化されたタスクの解決方法が直接決定される。
平面と6-DoFの移動操作タスク全体にわたって、対称性にインフォームドされたポリシーは、サンプル効率を一貫して改善する。
- 参考スコア(独自算出の注目度): 25.389467312557127
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile manipulation requires coordinated control of high-dimensional, bimanual robots. Imitation learning methods have been broadly used to solve these robotic tasks, yet typically ignore the bilateral morphological symmetry inherent in such systems. We argue that morphological symmetry is an underexplored but crucial inductive bias for learning in bimanual mobile manipulation: knowing how to solve a task in one configuration directly determines how to solve its mirrored counterpart. In this paper, we formalize this symmetry prior and show that it constrains optimal bimanual policies to be ambidextrous and equivariant under reflections across the robot's sagittal plane. We introduce a $\mathbb{C}_2$-equivariant flow matching policy that enforces reflective symmetry either via a regularized training loss or an equivariant velocity network. Across planar and 6-DoF mobile manipulation tasks, symmetry-informed policies consistently improve sample efficiency and achieve zero-shot generalization to mirrored configurations absent from the training distribution. We further validate this zero-shot generalization capability on a real-world manipulation task with a TIAGo++ robot. Together, our findings establish morphological symmetry as an effective, generalizable, and scalable inductive bias for ambidextrous generative policy learning.
- Abstract(参考訳): 移動操作には高次元の双対ロボットの協調制御が必要である。
模倣学習法は、これらのロボットの課題を解決するために広く用いられてきたが、一般的には、そのようなシステムに固有の左右の形態的対称性を無視する。
形態的対称性は、二元的移動操作の学習において、過度に探索されているが決定的な帰納的バイアスであり、ある構成においてタスクの解法を知ることは、そのミラー化の解法を直接決定する。
本稿では,この対称性を前もって定式化し,ロボットの矢状面を横切る反射の下で,両面の最適方針を曖昧かつ同変に制約することを示す。
正規化学習損失または同変速度ネットワークを介して反射対称性を強制する$\mathbb{C}_2$-equivariant flow matching Policyを導入する。
平面と6-DoFの移動操作タスク全体にわたって、対称性インフォームドポリシーはサンプル効率を一貫して改善し、トレーニング分布から外れたミラー構成へのゼロショット一般化を実現する。
さらに,TIAGo++ロボットを用いた実世界の操作タスクにおいて,このゼロショット一般化能力を検証した。
本研究は, 両立型生成政策学習に有効な, 一般化可能な, スケーラブルな帰納的バイアスとして, 形態対称性を確立した。
関連論文リスト
- HarmoWAM: Harmonizing Generalizable and Precise Manipulation via Adaptive World Action Models [58.191567345416836]
世界行動モデル(WAM)は、物理力学のモデリングによるロボット制御のための有望なパラダイムとして登場した。
HarmoWAMは、予測と反応の制御を統一するために世界モデルを完全に活用し、一般的なトランジットと正確な操作を可能にする。
実世界の6つのロボットタスクにまたがる3つのトレーニング未確認テスト環境を構築し、背景、位置、オブジェクトの意味のバリエーションをカバーした。
論文 参考訳(メタデータ) (2026-05-11T17:59:56Z) - EquiBim: Learning Symmetry-Equivariant Policy for Bimanual Manipulation [6.9686350006975]
EquiBimは、二元的操作のための対称性に等価なポリシー学習フレームワークである。
我々のアプローチは、観測空間と作用空間の両方における群作用として物理対称性を定式化する。
本研究は,シミュレーションにおける多様な観察・行動構成にまたがって評価し,実世界のデュアルアームシステム上での検証を行う。
論文 参考訳(メタデータ) (2026-03-09T16:09:18Z) - Structural Action Transformer for 3D Dexterous Manipulation [80.07649565189035]
クロス・エボディメント・スキル・トランスファーは、ハイDoFロボットハンドの課題である。
既存の手法は、しばしば2次元の観測と時間中心の行動表現に依存し、3次元の空間的関係を捉えるのに苦労する。
本稿では、構造中心の視点を導入することで、このパラダイムに挑戦する新しい3Dデクスタラスな操作ポリシーを提案する。
論文 参考訳(メタデータ) (2026-03-04T11:38:12Z) - Morphologically Symmetric Reinforcement Learning for Ambidextrous Bimanual Manipulation [12.053370079908325]
両操作の強化学習フレームワークであるSYMDEXを紹介する。
等変ニューラルネットワークによる左右対称の利用により、一方の腕からの体験は本質的に反対側の腕によって活用される。
我々のアプローチは、左手と右手が異なる役割を演じる複雑なタスクのベースラインを強く上回ります。
論文 参考訳(メタデータ) (2025-05-08T14:29:00Z) - Action Flow Matching for Continual Robot Learning [54.10050120844738]
ロボット工学における継続的な学習は、変化する環境やタスクに常に適応できるシステムを求める。
本稿では,オンラインロボット力学モデルアライメントのためのフローマッチングを利用した生成フレームワークを提案する。
ロボットは,不整合モデルで探索するのではなく,行動自体を変換することで,より効率的に情報収集を行う。
論文 参考訳(メタデータ) (2025-04-25T16:26:15Z) - Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids [56.892520712892804]
本稿では,ヒューマノイドロボットを訓練して3つの巧妙な操作を行う,実用的なシミュレート・トゥ・リアルなRLレシピを提案する。
未確認のオブジェクトやロバストで適応的な政策行動に対して高い成功率を示す。
論文 参考訳(メタデータ) (2025-02-27T18:59:52Z) - COMBO-Grasp: Learning Constraint-Based Manipulation for Bimanual Occluded Grasping [56.907940167333656]
集積ロボットグルーピングは、表面衝突などの環境制約により、所望のグルーピングポーズが運動的に不可能な場所である。
従来のロボット操作アプローチは、人間が一般的に使用する非包括的または双対的戦略の複雑さに苦しむ。
本稿では,2つの協調ポリシーを活用する学習ベースアプローチであるCOMBO-Grasp(Constraint-based Manipulation for Bimanual Occluded Grasping)を紹介する。
論文 参考訳(メタデータ) (2025-02-12T01:31:01Z) - Symmetry Considerations for Learning Task Symmetric Robot Policies [12.856889419651521]
シンメトリーは多くの現実世界のロボットタスクの基本的な側面である。
現在の深層強化学習(DRL)アプローチは、対称性を効果的に活用することは滅多にない。
論文 参考訳(メタデータ) (2024-03-07T09:41:11Z) - Sample Efficient Dynamics Learning for Symmetrical Legged
Robots:Leveraging Physics Invariance and Geometric Symmetries [14.848950116410231]
本稿では,基礎となるロボットシステムにおける対称性を利用したダイナミクスの学習手法を提案する。
ベクトル空間における全てのデータを表す既存のフレームワークは、ロボットの構造化情報を考えるのに失敗する。
論文 参考訳(メタデータ) (2022-10-13T19:57:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。