論文の概要: Robust Stochastic Shortest-Path Planning via Risk-Sensitive Incremental Sampling
- arxiv url: http://arxiv.org/abs/2408.08668v1
- Date: Fri, 16 Aug 2024 11:21:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-19 15:45:34.999301
- Title: Robust Stochastic Shortest-Path Planning via Risk-Sensitive Incremental Sampling
- Title(参考訳): リスク感性インクリメンタルサンプリングによるロバスト確率的ショートパス計画
- Authors: Clinton Enwerem, Erfaun Noorani, John S. Baras, Brian M. Sadler,
- Abstract要約: 本稿では,SSP問題に対するリスク対応型Rapidly-Exploring Random Trees (RRT*)計画アルゴリズムを提案する。
我々のモチベーションは、条件付きバリュー・アット・リスク尺度(CVaR)の段階的コヒーレンスと、SSP問題の最適部分構造に依存している。
解析の結果,木の成長過程にリスクを組み込むことで,騒音パラメータの変動に敏感でない長さの経路が得られることがわかった。
- 参考スコア(独自算出の注目度): 9.651071174735804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the pervasiveness of Stochastic Shortest-Path (SSP) problems in high-risk industries, such as last-mile autonomous delivery and supply chain management, robust planning algorithms are crucial for ensuring successful task completion while mitigating hazardous outcomes. Mainstream chance-constrained incremental sampling techniques for solving SSP problems tend to be overly conservative and typically do not consider the likelihood of undesirable tail events. We propose an alternative risk-aware approach inspired by the asymptotically-optimal Rapidly-Exploring Random Trees (RRT*) planning algorithm, which selects nodes along path segments with minimal Conditional Value-at-Risk (CVaR). Our motivation rests on the step-wise coherence of the CVaR risk measure and the optimal substructure of the SSP problem. Thus, optimizing with respect to the CVaR at each sampling iteration necessarily leads to an optimal path in the limit of the sample size. We validate our approach via numerical path planning experiments in a two-dimensional grid world with obstacles and stochastic path-segment lengths. Our simulation results show that incorporating risk into the tree growth process yields paths with lengths that are significantly less sensitive to variations in the noise parameter, or equivalently, paths that are more robust to environmental uncertainty. Algorithmic analyses reveal similar query time and memory space complexity to the baseline RRT* procedure, with only a marginal increase in processing time. This increase is offset by significantly lower noise sensitivity and reduced planner failure rates.
- Abstract(参考訳): 最終マイルの自律配送やサプライチェーン管理といったリスクの高い産業におけるSSP(Stochastic Shortest-Path)問題の普及に伴い、ロバストな計画アルゴリズムは、有害な成果を軽減しつつ、タスク完了を成功させるのに不可欠である。
メインストリームの確率制約インクリメンタルサンプリング技術は、SSP問題を解決するには保守的すぎる傾向があり、通常は望ましくない尾イベントの可能性を考慮しない。
本稿では,漸近的に最適化されたRapidly-Exploring Random Trees (RRT*)計画アルゴリズムに着想を得たリスク認識手法を提案する。
我々のモチベーションは、CVaRリスク尺度の段階的コヒーレンスとSSP問題の最適部分構造に依存している。
したがって、各サンプリング繰り返しにおけるCVaRの最適化は、必ずしもサンプルサイズに制限のある最適経路につながる。
我々は,障害物と確率的経路分割長を持つ2次元格子空間における数値経路計画実験によるアプローチの有効性を検証した。
解析の結果,木の成長過程にリスクを組み込むことで,騒音パラメータの変動に対する感受性が著しく低い経路,あるいは環境の不確実性に対してより堅牢な経路が得られることがわかった。
アルゴリズム解析により、ベースラインRT*プロシージャに類似したクエリ時間とメモリ空間の複雑さが明らかとなり、処理時間が極端に増加する。
この増加は、ノイズ感度を著しく低下させ、プランナーの故障率を低下させることで相殺される。
関連論文リスト
- A Sample Efficient Alternating Minimization-based Algorithm For Robust Phase Retrieval [56.67706781191521]
そこで本研究では,未知の信号の復元を課題とする,ロバストな位相探索問題を提案する。
提案するオラクルは、単純な勾配ステップと外れ値を用いて、計算学的スペクトル降下を回避している。
論文 参考訳(メタデータ) (2024-09-07T06:37:23Z) - Risk-averse Learning with Non-Stationary Distributions [18.15046585146849]
本稿では,ランダムなコスト分布が時間とともに変化するリスク-逆オンライン最適化について検討する。
リスクの条件値(CVaR)をリスク尺度として用いたリスク逆目的関数を最小化する。
設計した学習アルゴリズムは,凸関数と凸関数の両方に対して高い確率で線形動的後悔を実現する。
論文 参考訳(メタデータ) (2024-04-03T18:16:47Z) - CBAGAN-RRT: Convolutional Block Attention Generative Adversarial Network
for Sampling-Based Path Planning [0.0]
本稿では,畳み込みブロック注意生成ネットワークを用いた新しい画像ベース学習アルゴリズム(CBAGAN-RRT)を提案する。
GANモデルから生成された経路の確率分布を用いて,RRTアルゴリズムのサンプリングプロセスを導出する。
我々は、citezhang 2021によって生成されたデータセット上で、我々のネットワークをトレーニングし、テストし、我々のアルゴリズムが過去の最先端アルゴリズムより優れていることを示す。
論文 参考訳(メタデータ) (2023-05-13T20:06:53Z) - Fully Stochastic Trust-Region Sequential Quadratic Programming for
Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。
アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文 参考訳(メタデータ) (2022-11-29T05:52:17Z) - Structural Estimation of Markov Decision Processes in High-Dimensional
State Space with Finite-Time Guarantees [39.287388288477096]
本研究では,実施行動と訪問状態の観測可能な履歴に基づいて,人間エージェントによる動的決定の構造モデルの推定作業を検討する。
この問題には固有のネスト構造があり、内部問題では与えられた報酬関数に対する最適ポリシーが特定され、外部問題では適合度の測定が最大化される。
本研究では,高次元状態空間を扱うための有限時間保証付き単一ループ推定アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-04T00:11:38Z) - Risk-aware Stochastic Shortest Path [0.0]
マルコフ決定過程(MDP)における最短経路(SSP)に対するリスク認識制御の問題点について検討する。
本稿では,確立されたリスク尺度である条件付きリスク(CVaR)を最適化する。
論文 参考訳(メタデータ) (2022-03-03T10:59:54Z) - Online Estimation and Optimization of Utility-Based Shortfall Risk [0.9999629695552195]
UBSR(Utility-Based Shortfall Risk)の推定問題について考察する。
UBSR推定問題をルート探索問題とみなし,近似に基づく推定手法を提案する。
サンプル数における推定誤差の非漸近境界を導出する。
論文 参考訳(メタデータ) (2021-11-16T22:16:03Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - MLE-guided parameter search for task loss minimization in neural
sequence modeling [83.83249536279239]
ニューラル自己回帰シーケンスモデルは、さまざまな自然言語処理(NLP)タスクのシーケンスを生成するために使用される。
本稿では,現在のパラメータとその周辺における乱探索の混合である更新方向の分布から,最大至適勾配の分布をサンプリングする,最大至適誘導パラメータ探索(MGS)を提案する。
以上の結果から,MGS は,機械翻訳における最小リスクトレーニングに比べて,繰り返しや非終端の大幅な削減を図り,シーケンスレベルの損失を最適化できることが示唆された。
論文 参考訳(メタデータ) (2020-06-04T22:21:22Z) - Robust Reinforcement Learning with Wasserstein Constraint [49.86490922809473]
最適なロバストなポリシーの存在を示し、摂動に対する感度分析を行い、新しいロバストな学習アルゴリズムを設計する。
提案アルゴリズムの有効性はCart-Pole環境で検証する。
論文 参考訳(メタデータ) (2020-06-01T13:48:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。