論文の概要: EnergyAction: Unimanual to Bimanual Composition with Energy-Based Models
- arxiv url: http://arxiv.org/abs/2603.20236v1
- Date: Mon, 09 Mar 2026 04:50:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:12.928618
- Title: EnergyAction: Unimanual to Bimanual Composition with Energy-Based Models
- Title(参考訳): Energy Action:Energy-based Modelを用いた一対二構成
- Authors: Mingchen Song, Xiang Deng, Jie Wei, Dongmei Jiang, Liqiang Nie, Weili Guan,
- Abstract要約: EnergyActionは、一元的操作ポリシーを二元的タスクに合成する新しいフレームワークである。
まず,個々の一元的政策をEMMとしてモデル化し,その構成特性を利用して左腕と右腕の動作を構成する。
第2に,エネルギー制約を通した時空間協調機構を導入する。
第3に,行動品質評価に基づいて動的に認知段階を適応させる2つの異なるエネルギー認知型認知戦略を提案する。
- 参考スコア(独自算出の注目度): 73.21721376238233
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advances in unimanual manipulation policies have achieved remarkable success across diverse robotic tasks through abundant training data and well-established model architectures. However, extending these capabilities to bimanual manipulation remains challenging due to the lack of bimanual demonstration data and the complexity of coordinating dual-arm actions. Existing approaches either rely on extensive bimanual datasets or fail to effectively leverage pre-trained unimanual policies. To address this limitation, we propose \textbf{EnergyAction}, a novel framework that compositionally transfers unimanual manipulation policies to bimanual tasks through the Energy-Based Models (EBMs). Specifically, our method incorporates three key innovations. First, we model individual unimanual policies as EBMs and leverage their compositional properties to compose left and right arm actions, enabling the fusion of unimanual policies into a bimanual policy. Second, we introduce an energy-based temporal-spatial coordination mechanism through energy constraints, ensuring the generated bimanual actions are both temporal coherence and spatial feasibility. Third, we propose two different energy-aware denoising strategies that dynamically adapt denoising steps based on action quality assessment. These strategies ensure the generation of high-quality actions while maintaining superior computational efficiency compared to fixed-step denoising approaches. Experimental results demonstrate that EnergyAction effectively transfers unimanual knowledge to bimanual tasks, achieving superior performance on both simulated and real-world tasks with minimal bimanual data.
- Abstract(参考訳): 一元的な操作ポリシーの最近の進歩は、豊富なトレーニングデータと確立されたモデルアーキテクチャを通して、多様なロボットタスクで顕著な成功を収めている。
しかし,両腕動作のコーディネートが困難であることや,両腕動作のコーディネートが困難であることから,これらの能力を両腕操作に拡張することは依然として困難である。
既存のアプローチは、広範な双方向データセットに依存するか、事前訓練された単一ポリシーを効果的に活用できないかのいずれかである。
この制限に対処するために、エネルギーベースモデル(EBM)を通して一元的操作ポリシーを二元的タスクに合成する新しいフレームワークである「textbf{EnergyAction}」を提案する。
特に,本手法には3つの重要な革新が組み込まれている。
まず、個々の一元的政策をEMMとしてモデル化し、その構成特性を活用して、左右の腕の動きを構成することにより、一元的政策を二元的政策に融合させる。
第2に,エネルギー制約を通した時間空間協調機構を導入し,生成したバイマンダル動作が時間的コヒーレンスと空間的実現可能性の両方を確実にする。
第3に,行動品質評価に基づいて動的に認知段階を適応させる2つの異なるエネルギー認知型認知戦略を提案する。
これらの戦略は、固定ステップのデノイングアプローチよりも優れた計算効率を維持しながら、高品質なアクションの生成を保証する。
実験結果から,EnergyActionは一元的知識を二元的タスクに効果的に伝達し,二元的データを最小限に抑えたシミュレーションと実世界のタスクにおいて優れた性能を発揮することが示された。
関連論文リスト
- Unified Learning of Temporal Task Structure and Action Timing for Bimanual Robot Manipulation [11.051601535345819]
時間的タスク構造は、バイマニュアル操作の基本である。
既存のアプローチでは、これらの2つのレベルを分離しています。
本研究は,人間の実演から象徴的・象徴的な時間的制約を学習するためのアプローチを提案する。
論文 参考訳(メタデータ) (2026-03-06T18:25:42Z) - BiKC+: Bimanual Hierarchical Imitation with Keypose-Conditioned Coordination-Aware Consistency Policies [25.25845809170421]
両手操作に適したキープレイス条件付き協調型整合性ポリシーを提案する。
本フレームワークは,階層的模倣学習を高レベルなキープレース予測器と低レベルな軌道生成器で実現する。
特に,ロボット中心の動作特徴とタスク中心の操作スタイルの両方を考慮することで,バイマニュアルのキープットを識別するための革新的なアプローチを考案する。
論文 参考訳(メタデータ) (2026-01-17T17:33:18Z) - Fast Visuomotor Policy for Robotic Manipulation [31.26284715644132]
エネルギー政策は、高周波ロボットタスクと資源制約システムのために設計されている。
単一のフォワードパスにおけるマルチモーダル動作を予測し、高速で高精度な操作を可能にする。
その結果、エネルギー政策は最先端の操作方法のパフォーマンスにマッチするか、超越しているかを示す。
論文 参考訳(メタデータ) (2025-10-14T13:18:45Z) - Rethinking Bimanual Robotic Manipulation: Learning with Decoupled Interaction Framework [51.39847596489193]
バイオマチックなロボット操作は、ロボティクスコミュニティにおいて、新しくて重要なトピックである。
本稿では,バイマニュアル操作における異なるタスクの特徴を考察した,疎結合なインタラクションフレームワークを提案する。
我々のフレームワークは,SOTA法よりも23.5%向上し,優れた性能を実現している。
論文 参考訳(メタデータ) (2025-03-12T09:28:41Z) - COMBO-Grasp: Learning Constraint-Based Manipulation for Bimanual Occluded Grasping [56.907940167333656]
集積ロボットグルーピングは、表面衝突などの環境制約により、所望のグルーピングポーズが運動的に不可能な場所である。
従来のロボット操作アプローチは、人間が一般的に使用する非包括的または双対的戦略の複雑さに苦しむ。
本稿では,2つの協調ポリシーを活用する学習ベースアプローチであるCOMBO-Grasp(Constraint-based Manipulation for Bimanual Occluded Grasping)を紹介する。
論文 参考訳(メタデータ) (2025-02-12T01:31:01Z) - PIVOT-R: Primitive-Driven Waypoint-Aware World Model for Robotic Manipulation [68.17081518640934]
ロボット操作のためのPrIrmitive-driVen waypOinT-aware world model(PIVOT-R)を提案する。
PIVOT-RはWAWM(Waypoint-aware World Model)と軽量アクション予測モジュールで構成される。
私たちのPIVOT-RはSeaWaveベンチマークで最先端のオープンソースモデルより優れており、4段階の命令タスクで平均19.45%の相対的な改善を実現しています。
論文 参考訳(メタデータ) (2024-10-14T11:30:18Z) - BiKC: Keypose-Conditioned Consistency Policy for Bimanual Robotic Manipulation [48.08416841005715]
両面操作に適したキーポーズ条件の整合性ポリシーを導入する。
階層的な模倣学習フレームワークであり、ハイレベルなキープレース予測器と低レベルな軌道生成器から構成される。
シミュレーションおよび実世界の実験結果から,提案手法は成功率と運用効率の点で基準法を超越していることが示された。
論文 参考訳(メタデータ) (2024-06-14T14:49:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。