論文の概要: Hierarchical Reinforcement Learning Framework for Stochastic Spaceflight
Campaign Design
- arxiv url: http://arxiv.org/abs/2103.08981v1
- Date: Tue, 16 Mar 2021 11:17:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 13:18:00.029533
- Title: Hierarchical Reinforcement Learning Framework for Stochastic Spaceflight
Campaign Design
- Title(参考訳): 確率的宇宙飛行キャンペーン設計のための階層的強化学習フレームワーク
- Authors: Yuji Takubo, Hao Chen, and Koki Ho
- Abstract要約: 本稿では,宇宙飛行計画のための階層的強化学習アーキテクチャを不確実性下で開発する。
本手法は,不確実な資源利用(ISRU)性能を有する,月面探査の一連のシナリオに適用する。
- 参考スコア(独自算出の注目度): 5.381116150823982
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper develops a hierarchical reinforcement learning architecture for
multi-mission spaceflight campaign design under uncertainty, including vehicle
design, infrastructure deployment planning, and space transportation
scheduling. This problem involves a high-dimensional design space and is
challenging especially with uncertainty present. To tackle this challenge, the
developed framework has a hierarchical structure with reinforcement learning
(RL) and network-based mixed-integer linear programming (MILP), where the
former optimizes campaign-level decisions (e.g., design of the vehicle used
throughout the campaign, destination demand assigned to each mission in the
campaign), whereas the latter optimizes the detailed mission-level decisions
(e.g., when to launch what from where to where). The framework is applied to a
set of human lunar exploration campaign scenarios with uncertain in-situ
resource utilization (ISRU) performance as a case study. The main value of this
work is its integration of the rapidly growing RL research and the existing
MILP-based space logistics methods through a hierarchical framework to handle
the otherwise intractable complexity of space mission design under uncertainty.
We expect this unique framework to be a critical steppingstone for the emerging
research direction of artificial intelligence for space mission design.
- Abstract(参考訳): 本稿では,多ミッション宇宙飛行計画のための階層的強化学習アーキテクチャを,車両設計,インフラ配置計画,宇宙輸送スケジューリングなど不確実性の下で開発する。
この問題は高次元の設計空間を伴い、特に不確実性が存在する場合には困難である。
この課題に対処するために開発されたフレームワークは、強化学習(RL)とネットワークベースの混合整数線形プログラミング(MILP)を備えた階層構造を持ち、前者はキャンペーンレベルの決定(例えば、キャンペーン全体で使用される車両の設計、キャンペーンの各ミッションに割り当てられた目的地要求)を最適化し、後者は詳細なミッションレベルの決定(例えば、どの場所からどこに打ち上げるか)を最適化する。
本フレームワークは,不確実な資源利用(ISRU)性能を事例として,月面探査の一連のシナリオに適用した。
この研究の主な価値は、急速に成長しているrl研究と既存のmilpベースの宇宙ロジスティクス手法を統合することである。
私たちは、このユニークなフレームワークが、宇宙ミッション設計のための人工知能の新たな研究方向性の足掛かりになることを期待しています。
関連論文リスト
- Self-reconfiguration Strategies for Space-distributed Spacecraft [17.70060501010008]
本稿では、将来の宇宙船が軌道上で異なる機能を持つモジュールを組み立てられる分散軌道上の宇宙船組立アルゴリズムを提案する。
軌道上での軌道上での自己再構成アルゴリズムは、分散宇宙船の利点を実現する上で重要な役割を担っている。
論文 参考訳(メタデータ) (2024-11-26T06:05:44Z) - LLMSat: A Large Language Model-Based Goal-Oriented Agent for Autonomous Space Exploration [0.0]
本研究は,宇宙船の高レベル制御システムとしてのLarge Language Models (LLMs)の適用について検討する。
一般的なゲームエンジンであるKerbal Space Programでシミュレートされた一連の深宇宙ミッションシナリオをケーススタディとして使用し、要求に対する実装を評価する。
論文 参考訳(メタデータ) (2024-04-13T03:33:17Z) - Long-HOT: A Modular Hierarchical Approach for Long-Horizon Object
Transport [83.06265788137443]
我々は、時間的拡張ナビゲーションのための新しいオブジェクトトランスポートタスクと新しいモジュラーフレームワークを提案することで、長距離探査と航法を具現化する上で重要な課題に対処する。
私たちの最初の貢献は、深層探査と長期計画に焦点を当てた新しいLong-HOT環境の設計である。
重み付けされたフロンティアの助けを借りて探索を行うために,シーンのトポロジカルグラフを構築するモジュラー階層輸送ポリシー(HTP)を提案する。
論文 参考訳(メタデータ) (2022-10-28T05:30:49Z) - Overcoming Exploration: Deep Reinforcement Learning in Complex
Environments from Temporal Logic Specifications [2.8904578737516764]
本稿では,大規模複雑な環境に展開する未知の連続時間ダイナミクスを有するタスク誘導型ロボットのためのDeep Reinforcement Learning (DRL)アルゴリズムを提案する。
本フレームワークは,大規模複雑な環境下での複雑なミッションをこなすロボットの性能(有効性,効率)を著しく向上させる。
論文 参考訳(メタデータ) (2022-01-28T16:39:08Z) - Successor Feature Landmarks for Long-Horizon Goal-Conditioned
Reinforcement Learning [54.378444600773875]
大規模で高次元の環境を探索するフレームワークであるSFL(Successor Feature Landmarks)を紹介する。
SFLは、状態のノベルティを推定して探索を推進し、状態空間を非パラメトリックなランドマークベースのグラフとして抽象化することで、高レベルな計画を可能にする。
我々は,MiniGrid と ViZDoom の実験において,SFL が大規模高次元状態空間の効率的な探索を可能にすることを示す。
論文 参考訳(メタデータ) (2021-11-18T18:36:05Z) - Design Strategy Network: A deep hierarchical framework to represent
generative design strategies in complex action spaces [0.0]
この研究は、任意の複雑なアクション空間上の戦略を学習するデータ駆動の深層階層型フレームワークであるDesign Strategy Network (DSN)を紹介する。
階層的アーキテクチャは、すべてのアクション決定を分解し、設計空間における好ましい空間領域を第一に予測する。
その結果, DSNは政策表現の非階層的手法よりも優れていた。
論文 参考訳(メタデータ) (2021-10-07T19:29:40Z) - Landmark Policy Optimization for Object Navigation Task [77.34726150561087]
本研究は,未確認環境において,与えられたセマンティックカテゴリに関連する最も近いオブジェクトにナビゲートするオブジェクトゴールナビゲーションタスクについて研究する。
最近の研究は、エンドツーエンドの強化学習アプローチとモジュールシステムの両方において大きな成果を上げていますが、堅牢で最適なものにするには大きな前進が必要です。
本稿では,これらのランドマークを抽出する手法として,標準的なタスクの定式化とランドマークとしての付加的な地域知識を取り入れた階層的手法を提案する。
論文 参考訳(メタデータ) (2021-09-17T12:28:46Z) - Temporal Predictive Coding For Model-Based Planning In Latent Space [80.99554006174093]
時間的に予測可能な環境要素を符号化するために,時間的予測符号化を用いた情報理論的手法を提案する。
本稿では,DMControl タスクの背景を複雑な情報を含む自然なビデオに置き換える,標準的な DMControl タスクの挑戦的な修正について評価する。
論文 参考訳(メタデータ) (2021-06-14T04:31:15Z) - Constrained optimisation of preliminary spacecraft configurations under
the design-for-demise paradigm [1.0205541448656992]
現在打ち上げられ、既に軌道上にある中規模の衛星のほとんどは、0.0001の死亡リスク閾値を満たさない。
衛星メーカーとミッションオペレーターは、制御された再突入を通じて処理を行う必要がある。
この追加コストと複雑さは、宇宙船が直接カジュアルリスク規制に準拠しているため取り除くことができる。
論文 参考訳(メタデータ) (2020-12-27T17:48:29Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - Jump Operator Planning: Goal-Conditioned Policy Ensembles and Zero-Shot
Transfer [71.44215606325005]
本稿では,シーケンシャルなサブゴールタスクの超指数空間における解を高速に計算するための,Jump-Operator Dynamic Programmingという新しいフレームワークを提案する。
このアプローチでは、時間的に拡張された行動として機能する、再利用可能な目標条件付き警察のアンサンブルを制御する。
すると、この部分空間上の目的関数のクラスを、解がグラウンド化に不変であるものとして特定し、最適ゼロショット移動をもたらす。
論文 参考訳(メタデータ) (2020-07-06T05:13:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。