論文の概要: Path Planning and Reinforcement Learning-Driven Control of On-Orbit Free-Flying Multi-Arm Robots
- arxiv url: http://arxiv.org/abs/2603.23182v1
- Date: Tue, 24 Mar 2026 13:31:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.494549
- Title: Path Planning and Reinforcement Learning-Driven Control of On-Orbit Free-Flying Multi-Arm Robots
- Title(参考訳): 軌道上自由飛行型多関節ロボットの経路計画と強化学習駆動制御
- Authors: Álvaro Belmonte-Baeza, José Luis Ramón, Leonard Felicetti, Miguel Cazorla, Jorge Pomares,
- Abstract要約: 本稿では,軌道上における自由飛行型マルチアームロボットの動作計画と制御のための軌道最適化(TO)と強化学習(RL)を統合したハイブリッドアプローチを提案する。
高精度な身体制御のためのスラスタを備えたマルチアームロボット設計は、複雑な宇宙操作における冗長性と安定性を実現する。
- 参考スコア(独自算出の注目度): 1.0688341355376219
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a hybrid approach that integrates trajectory optimization (TO) and reinforcement learning (RL) for motion planning and control of free-flying multi-arm robots in on-orbit servicing scenarios. The proposed system integrates TO for generating feasible, efficient paths while accounting for dynamic and kinematic constraints, and RL for adaptive trajectory tracking under uncertainties. The multi-arm robot design, equipped with thrusters for precise body control, enables redundancy and stability in complex space operations. TO optimizes arm motions and thruster forces, reducing reliance on the arms for stabilization and enhancing maneuverability. RL further refines this by leveraging model-free control to adapt to dynamic interactions and disturbances. The experimental results validated through comprehensive simulations demonstrate the effectiveness and robustness of the proposed hybrid approach. Two case studies are explored: surface motion with initial contact and a free-floating scenario requiring surface approximation. In both cases, the hybrid method outperforms traditional strategies. In particular, the thrusters notably enhance motion smoothness, safety, and operational efficiency. The RL policy effectively tracks TO-generated trajectories, handling high-dimensional action spaces and dynamic mismatches. This integration of TO and RL combines the strengths of precise, task-specific planning with robust adaptability, ensuring high performance in the uncertain and dynamic conditions characteristic of space environments. By addressing challenges such as motion coupling, environmental disturbances, and dynamic control requirements, this framework establishes a strong foundation for advancing the autonomy and effectiveness of space robotic systems.
- Abstract(参考訳): 本稿では,軌道上における自由飛行型マルチアームロボットの動作計画と制御のための軌道最適化(TO)と強化学習(RL)を統合したハイブリッドアプローチを提案する。
提案システムは,動的および運動的制約を考慮しつつ,実現可能かつ効率的な経路を生成するTOと,不確実性下での適応軌道追跡のためのRLを統合した。
高精度な身体制御のためのスラスタを備えたマルチアームロボット設計は、複雑な宇宙操作における冗長性と安定性を実現する。
アームの動きと推力の最適化、安定と操作性向上のためのアームへの依存の軽減。
RLはモデルフリー制御を利用して動的相互作用や乱れに適応することでさらにこれを洗練する。
総合シミュレーションによって検証した実験結果は,提案手法の有効性とロバスト性を示すものである。
初期接触を伴う表面運動と表面近似を必要とする自由浮遊シナリオの2つのケーススタディが検討された。
どちらの場合も、ハイブリッド手法は従来の戦略よりも優れている。
特に、スラスタは運動の滑らかさ、安全性、操作効率を顕著に向上させる。
RLポリシーはTO生成軌道を効果的に追跡し、高次元のアクション空間と動的ミスマッチを処理する。
このTOとRLの統合は、厳密でタスク固有の計画と堅牢な適応性を組み合わせることで、宇宙環境特有の不確実かつ動的条件における高い性能を保証する。
運動結合、環境障害、動的制御要求といった課題に対処することにより、この枠組みは宇宙ロボットシステムの自律性と有効性を向上するための強力な基盤を確立する。
関連論文リスト
- ACLM: ADMM-Based Distributed Model Predictive Control for Collaborative Loco-Manipulation [9.708461585583791]
重荷のロコ操作による共同輸送は、脚のあるロボットにとって難しいが必須の能力である。
本研究は,ロコマニピュレーションのための分散モデル予測制御フレームワークであるマルチプライアの交互方向法を提案する。
論文 参考訳(メタデータ) (2026-03-07T08:06:51Z) - Action Space Reduction Strategies for Reinforcement Learning in Autonomous Driving [0.0]
強化学習(RL)は自動運転のための有望なフレームワークを提供する。
きめ細かい制御を支援するためにしばしば使われる大型で高次元のアクションスペースは、訓練の効率を阻害し、探査コストを増大させる。
我々は、自律運転におけるRLのための2つの新しい構造化された行動空間修正戦略を導入し、評価する。
論文 参考訳(メタデータ) (2025-07-07T17:58:08Z) - A Parallel Hybrid Action Space Reinforcement Learning Model for Real-world Adaptive Traffic Signal Control [10.9431172488753]
本稿では,交通信号の位相と所要時間を同時に最適化する並列ハイブリッド行動空間強化学習モデル(PH-DDPG)を提案する。
本モデルでは,個別位相選択と関連する継続時間パラメータを並列に出力する適応的トラフィック制御に適したタスク固有並列ハイブリッド動作空間を特徴とする。
論文 参考訳(メタデータ) (2025-03-18T13:38:53Z) - Simultaneous Multi-Robot Motion Planning with Projected Diffusion Models [57.45019514036948]
MRMP拡散(MRMP Diffusion, SMD)は, 制約付き最適化を拡散サンプリングプロセスに統合し, 衝突のない, キネマティックに実現可能な軌道を生成する新しい手法である。
本稿では, ロボット密度, 障害物の複雑度, 動作制約の異なるシナリオ間の軌道計画アルゴリズムを評価するための総合的MRMPベンチマークを提案する。
論文 参考訳(メタデータ) (2025-02-05T20:51:28Z) - Monte Carlo Tree Search with Velocity Obstacles for safe and efficient motion planning in dynamic environments [49.30744329170107]
本稿では,動的障害物に関する情報を最小限に抑えた最適オンライン動作計画手法を提案する。
提案手法は,モデルシミュレーションによるオンライン最適計画のためのモンテカルロ木探索 (MCTS) と障害物回避のためのVelocity Obstacles (VO) を組み合わせた。
我々は,非線形モデル予測制御(NMPC)を含む最先端のプランナーに対して,衝突速度,計算,タスク性能の向上の観点から,我々の方法論の優位性を示す。
論文 参考訳(メタデータ) (2025-01-16T16:45:08Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。