論文の概要: Reinforcement Learning with Prior Policy Guidance for Motion Planning of
Dual-Arm Free-Floating Space Robot
- arxiv url: http://arxiv.org/abs/2209.01434v1
- Date: Sat, 3 Sep 2022 14:20:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 14:42:50.325496
- Title: Reinforcement Learning with Prior Policy Guidance for Motion Planning of
Dual-Arm Free-Floating Space Robot
- Title(参考訳): 双腕自由浮遊型宇宙ロボットの運動計画のための事前方針指導による強化学習
- Authors: Yuxue Cao, Shengjie Wang, Xiang Zheng, Wenke Ma, Xinru Xie, Lei Liu
- Abstract要約: 提案手法は,計画精度を効率的に向上するRLに基づく手法を実現するための新しいアルゴリズムであるEfficientを提案する。
私たちのコアコントリビューションは、事前の知識ガイダンスと混合ポリシーを構築し、より合理的な報酬関数を構築するために無限ノルムを導入することです。
- 参考スコア(独自算出の注目度): 11.272278713797537
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning methods as a promising technique have achieved
superior results in the motion planning of free-floating space robots. However,
due to the increase in planning dimension and the intensification of system
dynamics coupling, the motion planning of dual-arm free-floating space robots
remains an open challenge. In particular, the current study cannot handle the
task of capturing a non-cooperative object due to the lack of the pose
constraint of the end-effectors. To address the problem, we propose a novel
algorithm, EfficientLPT, to facilitate RL-based methods to improve planning
accuracy efficiently. Our core contributions are constructing a mixed policy
with prior knowledge guidance and introducing infinite norm to build a more
reasonable reward function. Furthermore, our method successfully captures a
rotating object with different spinning speeds.
- Abstract(参考訳): 有望な技術としての強化学習手法は、自由浮遊型宇宙ロボットの運動計画において優れた結果を得た。
しかし、計画寸法の増大とシステムダイナミクスのカップリングの強化により、双腕自由浮遊型宇宙ロボットの動作計画がいまだに未解決の課題となっている。
特に,エンドエフェクタのポーズ制約が欠如しているため,非協力的なオブジェクトをキャプチャする作業は処理できない。
この問題に対処するために,RLに基づく手法により計画精度を効率的に向上する新しいアルゴリズム,EfficientLPTを提案する。
私たちの中心となる貢献は、事前知識指導による混合ポリシーの構築と、より合理的な報酬機能を構築するために無限規範の導入です。
さらに,回転速度の異なる回転物体を捕捉することに成功した。
関連論文リスト
- Trajectory Manifold Optimization for Fast and Adaptive Kinodynamic Motion Planning [5.982922468400902]
システムが動的に変化する環境に適応するためには、高速なキノダイナミックな運動計画が不可欠である。
本稿では,新しいニューラルネットワークモデル,その微分可能な運動マニフォールドプリミティブ(DMMP)と実践的なトレーニング戦略を提案する。
任意の目標位置への動的投球を行う7-DoFロボットアームを用いた実験により,提案手法が計画速度,タスク成功,制約満足度といった既存手法を超えることを示した。
論文 参考訳(メタデータ) (2024-10-16T03:29:33Z) - Bridging the gap between Learning-to-plan, Motion Primitives and Safe Reinforcement Learning [20.158498233576143]
キノダイナミック制約の下での軌道計画は、高度なロボティクス応用の基礎となる。
キノダイナミックプランニングの最近の進歩は、複雑な制約の下で複雑な動きを学習・計画技術が生成できることを実証している。
本稿では,学習から計画までの手法と強化学習を組み合わせることで,動作プリミティブのブラックボックス学習と最適化の新たな統合を実現する。
論文 参考訳(メタデータ) (2024-08-26T07:44:53Z) - Potential Based Diffusion Motion Planning [73.593988351275]
本稿では,潜在的行動計画の学習に向けた新しいアプローチを提案する。
我々はニューラルネットワークを訓練し、運動計画軌跡よりも容易に最適化可能なポテンシャルを捕捉し、学習する。
我々は、その固有の構成可能性を示し、様々な動きの制約に一般化することができる。
論文 参考訳(メタデータ) (2024-07-08T17:48:39Z) - Safe multi-agent motion planning under uncertainty for drones using
filtered reinforcement learning [6.783774261623415]
本稿では,強化学習と制約制御に基づく軌道計画の強みを生かした,トラクタブルな運動プランナを提案する。
提案手法は,学習のみに基づく手法よりも訓練が容易な,安全かつリアルタイムな実装可能なマルチエージェントモーションプランナを提供する。
論文 参考訳(メタデータ) (2023-10-31T18:09:26Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - Reaching Through Latent Space: From Joint Statistics to Path Planning in
Manipulation [26.38185646091712]
本稿では,ロボットマニピュレータのための経路計画手法を提案する。
経路は、ロボットのポーズ生成モデルの潜在空間における反復的最適化によって生成される。
我々のモデルはランダムにサンプリングされたロボットのポーズに基づいてタスク非依存で訓練されている。
論文 参考訳(メタデータ) (2022-10-21T07:25:21Z) - A Learning System for Motion Planning of Free-Float Dual-Arm Space
Manipulator towards Non-Cooperative Object [13.289739243378245]
本研究では,FFDASM(フリーフロート・デュアルアーム・スペース・マニピュレータ)の非協調物体に対する運動計画学習システムを提案する。
モジュールIは、大きなターゲット空間内の2つのエンドエフェクタに対するマルチターゲット軌道計画を実現する。
モジュールIIは、非協調対象の点雲を入力として運動特性を推定し、非協調対象の目標点の位置を予測する。
論文 参考訳(メタデータ) (2022-07-06T06:22:34Z) - Simultaneous Contact-Rich Grasping and Locomotion via Distributed
Optimization Enabling Free-Climbing for Multi-Limbed Robots [60.06216976204385]
移動, 把握, 接触問題を同時に解くための効率的な運動計画フレームワークを提案する。
ハードウェア実験において提案手法を実証し, より短い計画時間で, 傾斜角45degで自由クライミングを含む様々な動作を実現できることを示す。
論文 参考訳(メタデータ) (2022-07-04T13:52:10Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z) - Reinforcement Learning with Fast Stabilization in Linear Dynamical
Systems [91.43582419264763]
未知の安定化線形力学系におけるモデルベース強化学習(RL)について検討する。
本研究では,環境を効果的に探索することで,基盤システムの高速安定化を証明できるアルゴリズムを提案する。
提案アルゴリズムはエージェント環境相互作用の時間ステップで$tildemathcalO(sqrtT)$ regretを達成した。
論文 参考訳(メタデータ) (2020-07-23T23:06:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。