論文の概要: Contingency Planning Using Bi-level Markov Decision Processes for Space
Missions
- arxiv url: http://arxiv.org/abs/2402.16342v1
- Date: Mon, 26 Feb 2024 06:42:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-27 14:24:17.359342
- Title: Contingency Planning Using Bi-level Markov Decision Processes for Space
Missions
- Title(参考訳): バイレベルマルコフ決定プロセスを用いた宇宙ミッションの緊急計画
- Authors: Somrita Banerjee and Edward Balaban and Mark Shirley and Kevin Bradner
and Marco Pavone
- Abstract要約: この研究は、科学ミッションのための自律的な緊急計画に焦点を当てている。
これは、名目上のミッション計画からの遅延や逸脱が発生した場合に、州空間の任意の非正規点からの迅速なポリシー計算を可能にする。
- 参考スコア(独自算出の注目度): 16.62956274851929
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This work focuses on autonomous contingency planning for scientific missions
by enabling rapid policy computation from any off-nominal point in the state
space in the event of a delay or deviation from the nominal mission plan.
Successful contingency planning involves managing risks and rewards, often
probabilistically associated with actions, in stochastic scenarios. Markov
Decision Processes (MDPs) are used to mathematically model decision-making in
such scenarios. However, in the specific case of planetary rover traverse
planning, the vast action space and long planning time horizon pose
computational challenges. A bi-level MDP framework is proposed to improve
computational tractability, while also aligning with existing mission planning
practices and enhancing explainability and trustworthiness of AI-driven
solutions. We discuss the conversion of a mission planning MDP into a bi-level
MDP, and test the framework on RoverGridWorld, a modified GridWorld environment
for rover mission planning. We demonstrate the computational tractability and
near-optimal policies achievable with the bi-level MDP approach, highlighting
the trade-offs between compute time and policy optimality as the problem's
complexity grows. This work facilitates more efficient and flexible contingency
planning in the context of scientific missions.
- Abstract(参考訳): この研究は、名目上のミッション計画からの遅延や逸脱が発生した場合に、国家空間の任意の非公理点からの迅速な政策計算を可能にすることによって、科学ミッションのための自律的緊急計画に焦点を当てる。
コンティンジェンシー計画の成功には、確率的シナリオにおいて、しばしば行動と確率的に関連づけられるリスクと報酬の管理が伴う。
マルコフ決定プロセス(MDP)は、そのようなシナリオにおける意思決定を数学的にモデル化するために用いられる。
しかし、惑星ローバーの横断計画の特定の場合、広大な活動空間と長い計画時間地平線は計算上の問題を引き起こす。
計算トラクタビリティの向上に加えて、既存のミッション計画プラクティスと整合し、AI駆動型ソリューションの説明可能性と信頼性を高めるため、双方向のMDPフレームワークが提案されている。
ミッションプランニング MDP を二段階 MDP に転換することについて議論し、ローバーミッションプランニングのための改良された GridWorld 環境である RoverGridWorld 上でフレームワークをテストする。
両レベルのMDPアプローチで実現可能な計算トラクタビリティと準最適ポリシを実証し,問題の複雑性が増大するにつれて,計算時間と政策最適性のトレードオフを明らかにする。
この研究は、科学的ミッションの文脈におけるより効率的で柔軟な緊急計画を促進する。
関連論文リスト
- Platform-Aware Mission Planning [50.56223680851687]
本稿では,PAMP(Platform-Aware Mission Planning)の問題を紹介する。
第1のベースラインアプローチはミッションレベルとプラットフォームレベル、第2のベースラインアプローチは抽象リファインメントループに基づいている。
提案手法の健全性と完全性を実証し,実験により検証する。
論文 参考訳(メタデータ) (2025-01-16T16:20:37Z) - Learning Logic Specifications for Policy Guidance in POMDPs: an
Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。
我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。
ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文 参考訳(メタデータ) (2024-02-29T15:36:01Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - AdaPlanner: Adaptive Planning from Feedback with Language Models [56.367020818139665]
大規模言語モデル(LLM)は、最近、シーケンシャルな意思決定タスクの自律的エージェントとして機能する可能性を実証している。
本研究では,LLMエージェントが環境フィードバックに応じて自己生成計画を適応的に改善することのできるクローズドループアプローチであるAdaPlannerを提案する。
幻覚を緩和するために,様々なタスク,環境,エージェント機能にまたがる計画生成を容易にするコードスタイルのLCMプロンプト構造を開発した。
論文 参考訳(メタデータ) (2023-05-26T05:52:27Z) - A Framework for Neurosymbolic Robot Action Planning using Large Language Models [3.0501524254444767]
本稿では,象徴的タスク計画と機械学習アプローチのギャップを埋めることを目的としたフレームワークを提案する。
大規模言語モデル(LLM)を計画ドメイン定義言語(PDDL)と互換性のあるニューロシンボリックタスクプランナーに訓練する根拠
選択されたドメインにおける予備的な結果から, (i) テストデータセットの95.5%の問題を1,000個のサンプルで解決し, (ii) 従来のシンボルプランナーよりも最大13.5%短いプランを作成し, (iii) 計画の可利用性の平均待ち時間を61.4%まで削減する。
論文 参考訳(メタデータ) (2023-03-01T11:54:22Z) - Model-Free Reinforcement Learning for Optimal Control of MarkovDecision
Processes Under Signal Temporal Logic Specifications [7.842869080999489]
有限水平マルコフ決定過程に対する最適ポリシーを求めるためのモデルフリー強化学習アルゴリズムを提案する。
本稿では,不確実性および性能目標下での複雑なミッションにおけるロボット動作計画の文脈におけるアプローチの有効性について述べる。
論文 参考訳(メタデータ) (2021-09-27T22:44:55Z) - Anytime Stochastic Task and Motion Policies [12.72186877599064]
本稿では,タスクと動作計画を統合するための新しい手法を提案する。
我々のアルゴリズムは確率論的に完全であり、いつでも実現可能な解ポリシーを計算できる。
論文 参考訳(メタデータ) (2021-08-28T00:23:39Z) - Extended Task and Motion Planning of Long-horizon Robot Manipulation [28.951816622135922]
タスクとモーション計画(TAMP)には、シンボリック推論とメトリックモーション計画の統合が必要です。
ほとんどのtampアプローチは、シンボリックレベルで環境に関する知識が欠けている場合、実現可能なソリューションを提供しない。
本稿では,計画骨格と行動パラメータに対する決定空間の拡張に関する新たな意思決定手法を提案する。
論文 参考訳(メタデータ) (2021-03-09T14:44:08Z) - Bottom-up mechanism and improved contract net protocol for the dynamic
task planning of heterogeneous Earth observation resources [61.75759893720484]
地球観測資源は、災害救助、被害評価、関連する領域においてますます不可欠になりつつある。
観測要求の変更や悪天候の発生、資源の失敗など、予測できない多くの要因は、スケジュールされた観測計画が実行不可能になる可能性がある。
不均質な地球観測資源の動的タスク計画を容易にするため、ボトムアップ分散協調フレームワークと改良された契約網を提案する。
論文 参考訳(メタデータ) (2020-07-13T03:51:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。