論文の概要: Imitation Learning for Autonomous Trajectory Learning of Robot Arms in
Space
- arxiv url: http://arxiv.org/abs/2008.04007v1
- Date: Mon, 10 Aug 2020 10:18:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 22:27:41.056236
- Title: Imitation Learning for Autonomous Trajectory Learning of Robot Arms in
Space
- Title(参考訳): 宇宙におけるロボットアームの自律軌道学習のための模倣学習
- Authors: RB Ashith Shyam, Zhou Hao, Umberto Montanaro, Gerhard Neumann
- Abstract要約: 実演や模倣学習によるプログラミングの概念は、小型宇宙船に搭載されたマニピュレータの軌道計画に使用される。
7自由度(DoF)を持つロボットアームは、将来の宇宙ミッションにおける自律性の向上と地上制御による人間の介入の最小化のために、デブリ除去、軌道上サービス、組み立てといった複数のタスクを実行するために構想されている。
- 参考スコア(独自算出の注目度): 13.64392246529041
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work adds on to the on-going efforts to provide more autonomy to space
robots. Here the concept of programming by demonstration or imitation learning
is used for trajectory planning of manipulators mounted on small spacecraft.
For greater autonomy in future space missions and minimal human intervention
through ground control, a robot arm having 7-Degrees of Freedom (DoF) is
envisaged for carrying out multiple tasks like debris removal, on-orbit
servicing and assembly. Since actual hardware implementation of microgravity
environment is extremely expensive, the demonstration data for trajectory
learning is generated using a model predictive controller (MPC) in a physics
based simulator. The data is then encoded compactly by Probabilistic Movement
Primitives (ProMPs). This offline trajectory learning allows faster
reproductions and also avoids any computationally expensive optimizations after
deployment in a space environment. It is shown that the probabilistic
distribution can be used to generate trajectories to previously unseen
situations by conditioning the distribution. The motion of the robot (or
manipulator) arm induces reaction forces on the spacecraft hub and hence its
attitude changes prompting the Attitude Determination and Control System (ADCS)
to take large corrective action that drains energy out of the system. By having
a robot arm with redundant DoF helps in finding several possible trajectories
from the same start to the same target. This allows the ProMP trajectory
generator to sample out the trajectory which is obstacle free as well as having
minimal attitudinal disturbances thereby reducing the load on ADCS.
- Abstract(参考訳): この取り組みは、宇宙ロボットにさらなる自律性を提供するための、現在進行中の取り組みをさらに後押しする。
ここでは、実証または模倣学習によるプログラミングの概念が、小型宇宙船に搭載されたマニピュレータの軌道計画に使用される。
7自由度(DoF)を持つロボットアームは、将来の宇宙ミッションにおける自律性の向上と地上制御による人間の介入の最小化のために、デブリ除去、軌道上サービス、組み立てといった複数のタスクを実行するために構想されている。
微小重力環境のハードウェア実装は非常に高価であるため,物理シミュレーションのモデル予測コントローラ(MPC)を用いて軌道学習のための実演データを生成する。
データはProMP(Probabilistic Movement Primitives)によってコンパクトに符号化される。
このオフライン軌道学習は、より高速な再現を可能にし、スペース環境でのデプロイメント後に計算コストの高い最適化を回避する。
確率分布は, 分布を条件づけることにより, 以前に見つからなかった状況に対する軌道を生成することができる。
ロボット(またはマニピュレータ)アームの動作は、宇宙船ハブ上の反応力を誘導し、その姿勢が変化し、姿勢決定制御システム(ADCS)はシステムからエネルギーを排出する大規模な補正行動を起こす。
冗長なDoFを持つロボットアームを持つことで、同一のスタートから同一のターゲットまでのいくつかの軌道を見つけるのに役立つ。
これにより、ProMP軌道発生器は障害物のない軌道をサンプリングすることができ、また最小の方位障害を持つためADCSの負荷を低減できる。
関連論文リスト
- Self-reconfiguration Strategies for Space-distributed Spacecraft [17.70060501010008]
本稿では、将来の宇宙船が軌道上で異なる機能を持つモジュールを組み立てられる分散軌道上の宇宙船組立アルゴリズムを提案する。
軌道上での軌道上での自己再構成アルゴリズムは、分散宇宙船の利点を実現する上で重要な役割を担っている。
論文 参考訳(メタデータ) (2024-11-26T06:05:44Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Trace and Pace: Controllable Pedestrian Animation via Guided Trajectory
Diffusion [83.88829943619656]
本研究では,現実的な歩行者軌跡生成手法と,ユーザ定義目標を達成するために制御可能なフルボディアニメーションを提案する。
我々のガイド付き拡散モデルでは,対象とする経路,速度,特定社会集団による軌道の制約が可能である。
本稿では,アニメーションコントローラのRLトレーニング中に学習した値関数を用いて,拡散を誘導し,特定のシナリオに適した軌道を生成することを提案する。
論文 参考訳(メタデータ) (2023-04-04T15:46:42Z) - Obstacle Avoidance for Robotic Manipulator in Joint Space via Improved
Proximal Policy Optimization [6.067589886362815]
本稿では,6-DoFマニピュレータのタスク空間から関節空間にマップするために,改良されたPPOアルゴリズムを用いて深層ニューラルネットワークを訓練する。
実ロボットでそのようなタスクを訓練するのは時間を要するので、モデルを訓練するためのシミュレーション環境を開発する。
実験結果から,ロボットは非構造環境下で1つの目標をトラッキングしたり,複数の目標に到達することができた。
論文 参考訳(メタデータ) (2022-10-03T10:21:57Z) - Autonomous Aerial Robot for High-Speed Search and Intercept Applications [86.72321289033562]
高速物体把握のための完全自律飛行ロボットが提案されている。
追加のサブタスクとして、我々のシステムは、表面に近い極にある気球を自律的にピアスすることができる。
我々のアプローチは、挑戦的な国際競争で検証され、優れた結果が得られました。
論文 参考訳(メタデータ) (2021-12-10T11:49:51Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - DikpolaSat Mission: Improvement of Space Flight Performance and Optimal
Control Using Trained Deep Neural Network -- Trajectory Controller for Space
Objects Collision Avoidance [0.0]
本稿では,宇宙船を所望の経路に追従させることにより,制御器の実証を行う方法について述べる。
障害回避アルゴリズムは、ニューラルネットワークからの入力を使用して自然に応答する制御機能に組み込まれる。
飛行制御と燃料消費を最適化するための複数のアルゴリズムは、軌道の飛行力学の知識を用いて実装することができる。
論文 参考訳(メタデータ) (2021-05-30T23:35:13Z) - Learning Constrained Distributions of Robot Configurations with
Generative Adversarial Network [15.962033896896385]
高次元ロボットシステムでは、有効な構成空間の多様体はしばしば複素形状を持つ。
このような制約下で有効なロボット構成の分布を学習するための生成的敵ネットワークアプローチを提案する。
論文 参考訳(メタデータ) (2020-11-11T11:43:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。