論文の概要: Self-Curriculum Model-based Reinforcement Learning for Shape Control of Deformable Linear Objects
- arxiv url: http://arxiv.org/abs/2602.21816v1
- Date: Wed, 25 Feb 2026 11:44:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.707741
- Title: Self-Curriculum Model-based Reinforcement Learning for Shape Control of Deformable Linear Objects
- Title(参考訳): 変形可能な線形物体の形状制御のための自己計算モデルに基づく強化学習
- Authors: Zhaowei Liang, Song Wang, Zhao Jin, Shirui Wu, Dan Wu,
- Abstract要約: 強化学習とオンラインビジュアルサーボを組み合わせた2段階のフレームワークを提案する。
大規模化の段階では,サンプル効率を大幅に向上させるモデルに基づく強化学習手法が導入された。
小変形段階では、高精度収束を保証するためにヤコビアンベースのビジュアルサーボコントローラが配置される。
- 参考スコア(独自算出の注目度): 12.159491219171905
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precise shape control of Deformable Linear Objects (DLOs) is crucial in robotic applications such as industrial and medical fields. However, existing methods face challenges in handling complex large deformation tasks, especially those involving opposite curvatures, and lack efficiency and precision. To address this, we propose a two-stage framework combining Reinforcement Learning (RL) and online visual servoing. In the large-deformation stage, a model-based reinforcement learning approach using an ensemble of dynamics models is introduced to significantly improve sample efficiency. Additionally, we design a self-curriculum goal generation mechanism that dynamically selects intermediate-difficulty goals with high diversity through imagined evaluations, thereby optimizing the policy learning process. In the small-deformation stage, a Jacobian-based visual servo controller is deployed to ensure high-precision convergence. Simulation results show that the proposed method enables efficient policy learning and significantly outperforms mainstream baselines in shape control success rate and precision. Furthermore, the framework effectively transfers the policy trained in simulation to real-world tasks with zero-shot adaptation. It successfully completes all 30 cases with diverse initial and target shapes across DLOs of different sizes and materials. The project website is available at: https://anonymous.4open.science/w/sc-mbrl-dlo-EB48/
- Abstract(参考訳): 変形可能な線形物体(DLO)の精密形状制御は,産業や医療などのロボット分野において重要である。
しかし、既存の手法では複雑な大きな変形タスク、特に反対の曲率を含むタスクの処理が困難であり、効率と精度が欠如している。
そこで本稿では,Reinforcement Learning (RL) とオンラインビジュアルサーボを組み合わせた2段階のフレームワークを提案する。
大規模変形段階において, モデルに基づく強化学習手法を導入し, サンプル効率を大幅に向上させる。
さらに,予測された評価により,中間微分目標を多種多様で動的に選択する自己計算目標生成機構を設計し,政策学習プロセスを最適化する。
小変形段階では、高精度収束を保証するためにヤコビアンベースのビジュアルサーボコントローラが配置される。
シミュレーションの結果,提案手法は効率的な政策学習を可能にし,形状制御の成功率と精度において主流のベースラインを大幅に上回っていることがわかった。
さらに、このフレームワークは、シミュレーションで訓練されたポリシーをゼロショット適応で実世界のタスクに効果的に転送する。
異なるサイズと素材のDLOにまたがって、初期形状とターゲット形状の異なる30例すべてを完成させることに成功した。
プロジェクトのWebサイトは、https://anonymous.4open.science/w/sc-mbrl-dlo-EB48/で公開されている。
関連論文リスト
- Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Structuring a Training Strategy to Robustify Perception Models with Realistic Image Augmentations [1.5723316845301678]
本報告では, モデルロバスト性, 性能を向上させるため, 強化したトレーニング手法を提案する。
機械学習モデルの弱点を特定し、適切な拡張を選択し、効果的なトレーニング戦略を考案する包括的フレームワークを提案する。
実験結果は,オープンソースオブジェクトの検出とセマンティックセグメンテーションモデルとデータセットに対する平均平均精度(mAP)や平均距離(mIoU)といった一般的な測定値によって測定されるモデル性能の改善を示す。
論文 参考訳(メタデータ) (2024-08-30T14:15:48Z) - Learning visual-based deformable object rearrangement with local graph
neural networks [4.333220038316982]
本稿では,変形可能なオブジェクト状態とキーポイントの集合とその相互作用を効率的にモデル化できる新しい表現戦略を提案する。
また、変形可能な再配置ダイナミクスを共同でモデル化し、最適操作動作を推定するための光局所GNN学習を提案する。
本手法は, 各種変形可能なアレンジメントタスク(平均96.3%)において, シミュレーション実験における最先端手法よりもはるかに高い成功率を達成する。
論文 参考訳(メタデータ) (2023-10-16T11:42:54Z) - Model-Based Reinforcement Learning with Multi-Task Offline Pretraining [59.82457030180094]
本稿では,オフラインデータから新しいタスクへ,潜在的に有用なダイナミックスや動作デモを伝達するモデルベースRL法を提案する。
主な考え方は、世界モデルを行動学習のシミュレーターとしてだけでなく、タスクの関連性を測定するツールとして使うことである。
本稿では,Meta-WorldとDeepMind Control Suiteの最先端手法と比較して,我々のアプローチの利点を実証する。
論文 参考訳(メタデータ) (2023-06-06T02:24:41Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Learning Multi-Objective Curricula for Deep Reinforcement Learning [55.27879754113767]
深部強化学習(DRL)のサンプル効率と最終性能を向上させるために,各種自動カリキュラム学習(ACL)手法が提案されている。
本稿では,多目的だがコヒーレントなカリキュラムを作成するための統合された自動カリキュラム学習フレームワークを提案する。
既存の手設計のカリキュラムパラダイムに加えて,抽象カリキュラムを学習するためのフレキシブルなメモリ機構を設計する。
論文 参考訳(メタデータ) (2021-10-06T19:30:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。