論文の概要: RoTri-Diff: A Spatial Robot-Object Triadic Interaction-Guided Diffusion Model for Bimanual Manipulation
- arxiv url: http://arxiv.org/abs/2603.07165v1
- Date: Sat, 07 Mar 2026 12:12:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.04283
- Title: RoTri-Diff: A Spatial Robot-Object Triadic Interaction-Guided Diffusion Model for Bimanual Manipulation
- Title(参考訳): RoTri-Diff:双方向マニピュレーションのための空間ロボット-物体相互作用誘導拡散モデル
- Authors: Zixuan Chen, Nga Teng Chan, Yiwen Hou, Chenrui Tie, Zixuan Liu, Haonan Chen, Junting Chen, Jieqi Shi, Yang Gao, Jing Huo, Lin Shao,
- Abstract要約: 両腕操作は、両腕間の連続的かつ正確な調整を必要とする基本的なロボット技術である。
既存のアプローチでは、ロボット中心かオブジェクト中心かは、しばしば2つの腕と操作対象の間の動的幾何学的関係を見落としている。
この制限は、しばしば兵器間衝突、不安定な把握、複雑なタスクにおける性能低下につながる。
本稿では,RoTri制約とロボットのキーポーズとオブジェクトの動きを組み合わせた拡散型模倣学習フレームワークであるRoTri-Diffを紹介する。
- 参考スコア(独自算出の注目度): 44.32374761780659
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bimanual manipulation is a fundamental robotic skill that requires continuous and precise coordination between two arms. While imitation learning (IL) is the dominant paradigm for acquiring this capability, existing approaches, whether robot-centric or object-centric, often overlook the dynamic geometric relationship among the two arms and the manipulated object. This limitation frequently leads to inter-arm collisions, unstable grasps, and degraded performance in complex tasks. To address this, in this paper we explicitly models the Robot-Object Triadic Interaction (RoTri) representation in bimanual systems, by encoding the relative 6D poses between the two arms and the object to capture their spatial triadic relationship and establish continuous triangular geometric constraints. Building on this, we further introduce RoTri-Diff, a diffusion-based imitation learning framework that combines RoTri constraints with robot keyposes and object motion in a hierarchical diffusion process. This enables the generation of stable, coordinated trajectories and robust execution across different modes of bimanual manipulation. Extensive experiments show that our approach outperforms state-of-the-art baselines by 10.2% on 11 representative RLBench2 tasks and achieves stable performance on 4 challenging real-world bimanual tasks. Project website: https://rotri-diff.github.io/.
- Abstract(参考訳): 両腕操作は、両腕間の連続的かつ正確な調整を必要とする基本的なロボット技術である。
模倣学習(IL)は、この能力を獲得するための主要なパラダイムであるが、ロボット中心であれオブジェクト中心であれ、既存のアプローチは、しばしば2つの腕と操作対象の間の動的幾何学的関係を見落としている。
この制限は、しばしば兵器間衝突、不安定な把握、複雑なタスクにおける性能低下につながる。
そこで本論文では,両腕と物体間の相対的な6Dポーズを符号化し,それらの空間的3次元関係を捕捉し,連続的な三角形の幾何学的制約を定式化することにより,ロボット・オブジェクトの3次元インタラクション(RoTri)表現をバイマンシステムで明示的にモデル化する。
さらに,RoTri-Diffという拡散に基づく模倣学習フレームワークを導入し,ロボットのキーポーズとオブジェクトの動きを階層的拡散プロセスで組み合わせた。
これにより、安定な座標軌道の生成と、バイマニュアル操作の異なるモードでの堅牢な実行が可能になる。
大規模な実験により,11のRLBench2タスクに対して,最先端のベースラインを10.2%向上させ,実世界の4つの課題に対して安定した性能を実現することができた。
プロジェクトウェブサイト: https://rotri-diff.github.io/.com
関連論文リスト
- Structural Action Transformer for 3D Dexterous Manipulation [80.07649565189035]
クロス・エボディメント・スキル・トランスファーは、ハイDoFロボットハンドの課題である。
既存の手法は、しばしば2次元の観測と時間中心の行動表現に依存し、3次元の空間的関係を捉えるのに苦労する。
本稿では、構造中心の視点を導入することで、このパラダイムに挑戦する新しい3Dデクスタラスな操作ポリシーを提案する。
論文 参考訳(メタデータ) (2026-03-04T11:38:12Z) - AnchorDP3: 3D Affordance Guided Sparse Diffusion Policy for Robotic Manipulation [8.603450327406879]
AnchorDP3は、デュアルアームロボット操作のための拡散ポリシーフレームワークである。
大規模で手続き的に生成されたシミュレーションデータに基づいて訓練される。
RoboTwinベンチマークの平均成功率は98.7%に達する。
論文 参考訳(メタデータ) (2025-06-24T03:03:26Z) - Learning Video Generation for Robotic Manipulation with Collaborative Trajectory Control [72.00655365269]
本稿では,協調的軌跡定式化を通じてオブジェクト間ダイナミクスをモデル化する新しいフレームワークであるRoboMasterを紹介する。
オブジェクトを分解する従来の方法とは異なり、我々のコアは、相互作用プロセスを3つのサブステージ(相互作用前、相互作用後、相互作用後)に分解することである。
提案手法は既存の手法よりも優れており,ロボット操作のための軌道制御ビデオ生成における最先端性能を確立している。
論文 参考訳(メタデータ) (2025-06-02T17:57:06Z) - Modeling Continuous Motion for 3D Point Cloud Object Tracking [54.48716096286417]
本稿では,各トラックレットを連続ストリームとみなす新しいアプローチを提案する。
各タイムスタンプでは、現在のフレームだけがネットワークに送られ、メモリバンクに格納された複数フレームの履歴機能と相互作用する。
頑健な追跡のためのマルチフレーム機能の利用性を高めるために,コントラッシブシーケンス強化戦略を提案する。
論文 参考訳(メタデータ) (2023-03-14T02:58:27Z) - Deep Imitation Learning for Bimanual Robotic Manipulation [70.56142804957187]
本稿では,ロボットによるバイマニュアル操作のための深層模倣学習フレームワークを提案する。
中心となる課題は、操作スキルを異なる場所にあるオブジェクトに一般化することである。
i)マルチモーダルダイナミクスを要素運動プリミティブに分解し、(ii)リカレントグラフニューラルネットワークを用いて各プリミティブをパラメータ化して相互作用を捕捉し、(iii)プリミティブを逐次的に構成する高レベルプランナと、プリミティブダイナミクスと逆運動学制御を組み合わせた低レベルコントローラを統合することを提案する。
論文 参考訳(メタデータ) (2020-10-11T01:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。