論文の概要: Realizing Stabilized Landing for Computation-Limited Reusable Rockets: A
Quantum Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2310.06541v1
- Date: Tue, 10 Oct 2023 11:40:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-11 15:46:34.684082
- Title: Realizing Stabilized Landing for Computation-Limited Reusable Rockets: A
Quantum Reinforcement Learning Approach
- Title(参考訳): 計算限界再利用ロケットの安定着陸の実現:量子強化学習アプローチ
- Authors: Gyu Seon Kim, JaeHyun Chung, and Soohyun Park
- Abstract要約: 再利用可能なロケットの出現により、宇宙探査の新しい時代が到来し、衛星打ち上げのコストが大幅に削減された。
再利用可能なロケットの最も重要なフェーズは着陸段階であり、安全回復のための膨大な速度と姿勢を管理することである。
本稿では,再利用可能なロケットの制御システムへの量子強化学習の統合を,有望な代替手段として検討する。
- 参考スコア(独自算出の注目度): 0.9217021281095907
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The advent of reusable rockets has heralded a new era in space exploration,
reducing the costs of launching satellites by a significant factor. Traditional
rockets were disposable, but the design of reusable rockets for repeated use
has revolutionized the financial dynamics of space missions. The most critical
phase of reusable rockets is the landing stage, which involves managing the
tremendous speed and attitude for safe recovery. The complexity of this task
presents new challenges for control systems, specifically in terms of precision
and adaptability. Classical control systems like the
proportional-integral-derivative (PID) controller lack the flexibility to adapt
to dynamic system changes, making them costly and time-consuming to redesign of
controller. This paper explores the integration of quantum reinforcement
learning into the control systems of reusable rockets as a promising
alternative. Unlike classical reinforcement learning, quantum reinforcement
learning uses quantum bits that can exist in superposition, allowing for more
efficient information encoding and reducing the number of parameters required.
This leads to increased computational efficiency, reduced memory requirements,
and more stable and predictable performance. Due to the nature of reusable
rockets, which must be light, heavy computers cannot fit into them. In the
reusable rocket scenario, quantum reinforcement learning, which has reduced
memory requirements due to fewer parameters, is a good solution.
- Abstract(参考訳): 再利用可能なロケットの出現は、宇宙探査の新しい時代を告げ、人工衛星の打ち上げコストを大幅に削減した。
従来のロケットは使い捨てだったが、再利用可能なロケットの設計は宇宙ミッションの経済的ダイナミクスに革命をもたらした。
再利用ロケットの最も重要なフェーズは着陸段階であり、安全回復のための膨大な速度と姿勢を管理する。
このタスクの複雑さは、特に精度と適応性の観点から、制御システムに新たな課題をもたらす。
PIDコントローラのような古典的な制御システムは、動的システムの変更に適応する柔軟性に欠けており、コントローラの再設計にはコストと時間を要する。
本稿では,再利用可能なロケットの制御系への量子強化学習の統合について検討する。
古典的な強化学習とは異なり、量子強化学習は重ね合わせに存在する量子ビットを使用し、より効率的な情報符号化と必要なパラメータ数の削減を可能にする。
これにより計算効率が向上し、メモリ要求が減少し、安定的で予測可能な性能が向上する。
軽量でなければならない再利用可能なロケットの性質から、重いコンピュータは搭載できない。
再利用可能なロケットシナリオでは、パラメータの少ないためメモリ要件が削減された量子強化学習がよい解決策である。
関連論文リスト
- Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed [56.27022390372502]
我々は,1つのGPU上で数時間のトレーニングをしながら,競争力の高いベンチマーク結果を実現する,新しい効率的な動き予測モデルを提案する。
その低推論レイテンシは、特に限られたコンピューティングリソースを持つ自律アプリケーションへのデプロイに適している。
論文 参考訳(メタデータ) (2024-09-24T14:58:27Z) - Rocket Landing Control with Random Annealing Jump Start Reinforcement Learning [19.87058922821708]
本稿では,RLを用いた高忠実度ロケットモデルにおいて,ベースライン制御による8%から97%までのロケット着陸制御の成功率を著しく向上させる。
我々のアプローチはRandom Annealing Jump Start (RAJS)と呼ばれ、RLにおける環境探索と政策学習を促進するためのガイドポリシーとして、事前のフィードバックコントローラを活用することで、現実の目標志向の問題に合わせたものである。
論文 参考訳(メタデータ) (2024-07-21T07:47:53Z) - Precise and Efficient Orbit Prediction in LEO with Machine Learning using Exogenous Variables [1.9336815376402723]
地球の軌道における宇宙物体の量の増加は、宇宙状況認識(Space situational Awareness, SSA)にとって重要な課題である。
正確な軌道予測は、宇宙物体の位置と速度を予測し、衝突回避と宇宙デブリの緩和のために重要である。
機械学習と時系列技術を用いることで、計算コストが非常に低い位置決め誤差を発生させることができることを示す。
論文 参考訳(メタデータ) (2024-07-03T07:12:33Z) - Cost Explosion for Efficient Reinforcement Learning Optimisation of
Quantum Circuits [55.616364225463066]
強化学習(Reinforcement Learning, RL)は、量子回路を最適化する学習手法である。
私たちのゴールは、量子回路を手動で最適化する方法のヒントを含めることで、エージェントの最適化戦略を改善することです。
本稿では, コスト爆発を許容することは, 最適回路に到達するなど, RL トレーニングにおいて大きな利点をもたらすことを示す。
論文 参考訳(メタデータ) (2023-11-21T10:16:03Z) - Not Only Rewards But Also Constraints: Applications on Legged Robot Locomotion [2.7052274816160966]
本稿では,報酬と制約の両方からなる複雑なロボットシステムのためのニューラルネットワークコントローラをトレーニングするための,新しい強化学習フレームワークを提案する。
学習フレームワークは、異なる形態と物理的特性を持つ複数の脚を持つロボットのトレーニングコントローラに適用され、困難な地形を横断する。
論文 参考訳(メタデータ) (2023-08-24T03:06:20Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - DySMHO: Data-Driven Discovery of Governing Equations for Dynamical
Systems via Moving Horizon Optimization [77.34726150561087]
本稿では,スケーラブルな機械学習フレームワークである移動水平最適化(DySMHO)による動的システムの発見について紹介する。
DySMHOは、基底関数の大きな辞書から基礎となる支配方程式を逐次学習する。
標準非線形力学系の例は、DySMHOが規則を正確に回復できることを示すために用いられる。
論文 参考訳(メタデータ) (2021-07-30T20:35:03Z) - DikpolaSat Mission: Improvement of Space Flight Performance and Optimal
Control Using Trained Deep Neural Network -- Trajectory Controller for Space
Objects Collision Avoidance [0.0]
本稿では,宇宙船を所望の経路に追従させることにより,制御器の実証を行う方法について述べる。
障害回避アルゴリズムは、ニューラルネットワークからの入力を使用して自然に応答する制御機能に組み込まれる。
飛行制御と燃料消費を最適化するための複数のアルゴリズムは、軌道の飛行力学の知識を用いて実装することができる。
論文 参考訳(メタデータ) (2021-05-30T23:35:13Z) - Imitation Learning for Autonomous Trajectory Learning of Robot Arms in
Space [13.64392246529041]
実演や模倣学習によるプログラミングの概念は、小型宇宙船に搭載されたマニピュレータの軌道計画に使用される。
7自由度(DoF)を持つロボットアームは、将来の宇宙ミッションにおける自律性の向上と地上制御による人間の介入の最小化のために、デブリ除去、軌道上サービス、組み立てといった複数のタスクを実行するために構想されている。
論文 参考訳(メタデータ) (2020-08-10T10:18:04Z) - First Steps: Latent-Space Control with Semantic Constraints for
Quadruped Locomotion [73.37945453998134]
従来の四重化制御のアプローチでは、単純化された手作りのモデルが採用されている。
これにより、有効な運動範囲が縮小されているため、ロボットの能力が大幅に低下する。
この研究において、これらの課題は、構造化潜在空間における最適化として四重化制御をフレーミングすることによって解決される。
深い生成モデルは、実現可能な関節構成の統計的表現を捉え、一方、複雑な動的および終端的制約は高レベルな意味的指標によって表現される。
実世界とシミュレーションの両方で最適化された移動軌跡の実現可能性を検証する。
論文 参考訳(メタデータ) (2020-07-03T07:04:18Z) - Model-Based Meta-Reinforcement Learning for Flight with Suspended
Payloads [69.21503033239985]
吊り下げられたペイロードの輸送は、自律的な航空車両にとって困難である。
接続後飛行データから数秒以内に変化力学のモデルを学習するメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2020-04-23T17:43:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。