論文の概要: Eq.Bot: Enhance Robotic Manipulation Learning via Group Equivariant Canonicalization
- arxiv url: http://arxiv.org/abs/2511.15194v1
- Date: Wed, 19 Nov 2025 07:28:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.682886
- Title: Eq.Bot: Enhance Robotic Manipulation Learning via Group Equivariant Canonicalization
- Title(参考訳): Eq.Bot: グループ同変正準化によるロボットマニピュレーション学習の促進
- Authors: Jian Deng, Yuandong Wang, Yangfu Zhu, Tao Feng, Tianyu Wo, Zhenzhou Shao,
- Abstract要約: Eq.Botは、ロボット操作学習のためのSE(2)群同変理論に基づく普遍的な標準化フレームワークである。
我々のフレームワークは、観測結果を標準空間に変換し、既存のポリシーを適用し、結果のアクションを元の空間にマッピングする。
- 参考スコア(独自算出の注目度): 20.131111439320833
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robotic manipulation systems are increasingly deployed across diverse domains. Yet existing multi-modal learning frameworks lack inherent guarantees of geometric consistency, struggling to handle spatial transformations such as rotations and translations. While recent works attempt to introduce equivariance through bespoke architectural modifications, these methods suffer from high implementation complexity, computational cost, and poor portability. Inspired by human cognitive processes in spatial reasoning, we propose Eq.Bot, a universal canonicalization framework grounded in SE(2) group equivariant theory for robotic manipulation learning. Our framework transforms observations into a canonical space, applies an existing policy, and maps the resulting actions back to the original space. As a model-agnostic solution, Eq.Bot aims to endow models with spatial equivariance without requiring architectural modifications. Extensive experiments demonstrate the superiority of Eq.Bot under both CNN-based (e.g., CLIPort) and Transformer-based (e.g., OpenVLA-OFT) architectures over existing methods on various robotic manipulation tasks, where the most significant improvement can reach 50.0%.
- Abstract(参考訳): ロボット操作システムは、様々な領域にまたがってますます展開されている。
しかし、既存のマルチモーダル学習フレームワークには、幾何整合性の固有の保証がなく、回転や翻訳のような空間変換を扱うのに苦労している。
近年の研究では, 実装の複雑さ, 計算コスト, 可搬性に悩まされている。
ロボット操作学習のためのSE(2)群同変理論に基づく普遍的正準化フレームワークであるEq Botを提案する。
我々のフレームワークは、観測結果を標準空間に変換し、既存のポリシーを適用し、結果のアクションを元の空間にマッピングする。
モデルに依存しないソリューションとして、Eq Botは、構造的な変更を必要とせず、空間的等価性を持つモデルを育むことを目的としている。
大規模な実験では、CNNベースの(例えばCLIPort)とトランスフォーマーベースの(例えばOpenVLA-OFT)アーキテクチャの両方でEq Botが、様々なロボット操作タスクにおける既存のメソッドよりも優れていることが示され、最も重要な改善は50.0%に達する。
関連論文リスト
- RoBridge: A Hierarchical Architecture Bridging Cognition and Execution for General Robotic Manipulation [90.81956345363355]
RoBridgeは、一般的なロボット操作のための階層的なインテリジェントアーキテクチャである。
大規模事前学習型視覚言語モデル(VLM)に基づくハイレベル認知プランナー(HCP)で構成されている。
強化学習の手続き的スキルを解き放ち、認知と実行のギャップを効果的に埋める。
論文 参考訳(メタデータ) (2025-05-03T06:17:18Z) - SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey [2.514398251428326]
本チュートリアルでは,ロボット工学における多種多様な深層学習・制御手法について概説する。
視覚ロボットの操作と制御設計において, 自然な3次元回転と翻訳の対称性を利用するSE(3)-equivariantモデルに焦点をあてる。
論文 参考訳(メタデータ) (2025-03-12T20:47:40Z) - Universal Morphology Control via Contextual Modulation [52.742056836818136]
異なるロボット形態をまたいだ普遍的なポリシーの学習は、継続的な制御における学習効率と一般化を著しく向上させることができる。
既存の手法では、グラフニューラルネットワークやトランスフォーマーを使用して、異種状態と異なる形態のアクション空間を処理する。
本稿では,この依存関係を文脈変調によりモデル化する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-22T00:04:12Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - Deep Imitation Learning for Bimanual Robotic Manipulation [70.56142804957187]
本稿では,ロボットによるバイマニュアル操作のための深層模倣学習フレームワークを提案する。
中心となる課題は、操作スキルを異なる場所にあるオブジェクトに一般化することである。
i)マルチモーダルダイナミクスを要素運動プリミティブに分解し、(ii)リカレントグラフニューラルネットワークを用いて各プリミティブをパラメータ化して相互作用を捕捉し、(iii)プリミティブを逐次的に構成する高レベルプランナと、プリミティブダイナミクスと逆運動学制御を組み合わせた低レベルコントローラを統合することを提案する。
論文 参考訳(メタデータ) (2020-10-11T01:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。