論文の概要: SafeBimanual: Diffusion-based Trajectory Optimization for Safe Bimanual Manipulation
- arxiv url: http://arxiv.org/abs/2508.18268v1
- Date: Mon, 25 Aug 2025 17:59:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.906538
- Title: SafeBimanual: Diffusion-based Trajectory Optimization for Safe Bimanual Manipulation
- Title(参考訳): Safe Bimanual: 安全なバイマニピュレーションのための拡散に基づく軌道最適化
- Authors: Haoyuan Deng, Wenkai Guo, Qianzhun Wang, Zhenyu Wu, Ziwei Wang,
- Abstract要約: 双方向操作は家庭サービスや製造業に広く応用されている。
最近の拡散型政策学習アプローチは、バイマニュアル操作のための行動分布のモデル化において有望な性能を達成している。
本研究では,事前学習した拡散に基づく双方向操作ポリシーに対して,SafeBimanual というテスト時間軌道最適化フレームワークを提案する。
- 参考スコア(独自算出の注目度): 9.409693969316892
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bimanual manipulation has been widely applied in household services and manufacturing, which enables the complex task completion with coordination requirements. Recent diffusion-based policy learning approaches have achieved promising performance in modeling action distributions for bimanual manipulation. However, they ignored the physical safety constraints of bimanual manipulation, which leads to the dangerous behaviors with damage to robots and objects. To this end, we propose a test-time trajectory optimization framework named SafeBimanual for any pre-trained diffusion-based bimanual manipulation policies, which imposes the safety constraints on bimanual actions to avoid dangerous robot behaviors with improved success rate. Specifically, we design diverse cost functions for safety constraints in different dual-arm cooperation patterns including avoidance of tearing objects and collision between arms and objects, which optimizes the manipulator trajectories with guided sampling of diffusion denoising process. Moreover, we employ a vision-language model (VLM) to schedule the cost functions by specifying keypoints and corresponding pairwise relationship, so that the optimal safety constraint is dynamically generated in the entire bimanual manipulation process. SafeBimanual demonstrates superiority on 8 simulated tasks in RoboTwin with a 13.7% increase in success rate and a 18.8% reduction in unsafe interactions over state-of-the-art diffusion-based methods. Extensive experiments on 4 real-world tasks further verify its practical value by improving the success rate by 32.5%.
- Abstract(参考訳): 双方向操作は家庭サービスや製造において広く適用されており、複雑なタスク完了と調整要求が実現されている。
最近の拡散型政策学習アプローチは、バイマニュアル操作のための行動分布のモデル化において有望な性能を達成している。
しかし、両手操作の物理的安全性の制約を無視し、ロボットや物体に損傷を与える危険行動を引き起こした。
そこで本研究では,事前訓練された拡散に基づく双方向操作ポリシーに対してSafeBimanualというテスト時間軌道最適化フレームワークを提案する。
具体的には、剥離物体の剥離回避やアームと物体の衝突など、異なる両腕協調パターンにおける安全性制約のための多種多様なコスト関数を設計し、拡散復調プロセスのガイドサンプリングによるマニピュレータ軌道の最適化を行う。
さらに、視覚言語モデル(VLM)を用いて、キーポイントと対応するペア関係を指定してコスト関数をスケジューリングすることにより、最適安全制約を双方向操作全体において動的に生成する。
SafeBimanualは、RoboTwinの8つのシミュレーションタスクにおいて、13.7%の成功率の増加と18.8%の非安全相互作用の最先端拡散に基づく手法に対する優位性を実証している。
4つの実世界のタスクに関する大規模な実験は、成功率を32.5%向上させることで、その実用的価値をさらに検証している。
関連論文リスト
- AnyPos: Automated Task-Agnostic Actions for Bimanual Manipulation [24.199522837278128]
本稿では,タスク固有の条件からアクション実行を分離するタスク非依存のアクションパラダイムを提案する。
ATARAはスケーラブルなセルフ教師付きフレームワークで、人間の遠隔操作と比較して30倍以上のコレクションを高速化する。
我々はArm-Decoupled EstimationとDirection-Aware Decoderを備えた逆動的モデルであるAnyPosを提案する。
論文 参考訳(メタデータ) (2025-07-17T03:48:57Z) - DexHandDiff: Interaction-aware Diffusion Planning for Adaptive Dexterous Manipulation [78.60543357822957]
高度なロボティクスにとって、接触に富んだ相互作用による有害な操作が不可欠である。
DexHandDiffは,適応的デキスタラス操作のための対話型拡散計画フレームワークである。
当社のフレームワークは, 目標適応度の高いタスクにおいて, 平均70.7%の成功率を実現し, コンタクトリッチな操作における堅牢性と柔軟性を強調した。
論文 参考訳(メタデータ) (2024-11-27T18:03:26Z) - What Makes and Breaks Safety Fine-tuning? A Mechanistic Study [64.9691741899956]
安全性の微調整は、大規模な言語モデル(LLM)を、安全なデプロイメントのための人間の好みに合わせるのに役立つ。
安全でない入力の健全な側面をキャプチャする合成データ生成フレームワークを設計する。
これを用いて,3つのよく知られた安全微調整手法について検討する。
論文 参考訳(メタデータ) (2024-07-14T16:12:57Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Safe Machine-Learning-supported Model Predictive Force and Motion
Control in Robotics [0.0]
人間とロボットの相互作用や脆弱な物体のハンドリングのような多くのロボットタスクは、安全かつ高性能な操作を実現するために、動き制御と共に現れる力とモーメントの厳密な制御と制限を必要とする。
本研究では,学習支援型モデル予測力と運動制御方式を提案する。
論文 参考訳(メタデータ) (2023-03-08T13:30:02Z) - Active Uncertainty Reduction for Safe and Efficient Interaction
Planning: A Shielding-Aware Dual Control Approach [9.07774184840379]
本稿では,暗黙的二重制御パラダイムに基づく対話型動作計画における能動的不確実性低減を実現するアルゴリズムを提案する。
提案手法は, 動的プログラミングのサンプリングに基づく近似に依拠し, リアルタイム勾配最適化法で容易に解けるモデル予測制御問題に導かれる。
論文 参考訳(メタデータ) (2023-02-01T01:34:48Z) - Active Uncertainty Learning for Human-Robot Interaction: An Implicit
Dual Control Approach [5.05828899601167]
暗黙的な二重制御パラダイムに基づくループ内動作計画のための不確実性学習を実現するアルゴリズムを提案する。
提案手法は,動的プログラミングモデル予測制御問題のサンプリングに基づく近似に依拠する。
結果として得られたポリシーは、連続的およびカテゴリー的不確実性を持つ一般的な人間の予測モデルに対する二重制御効果を維持することが示されている。
論文 参考訳(メタデータ) (2022-02-15T20:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。