論文の概要: Dual Formulation for Chance Constrained Stochastic Shortest Path with
Application to Autonomous Vehicle Behavior Planning
- arxiv url: http://arxiv.org/abs/2302.13115v1
- Date: Sat, 25 Feb 2023 16:40:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 18:47:45.949222
- Title: Dual Formulation for Chance Constrained Stochastic Shortest Path with
Application to Autonomous Vehicle Behavior Planning
- Title(参考訳): 確率的最短経路の2重定式化と自律走行車行動計画への応用
- Authors: Rashid Alyassi and Majid Khonji
- Abstract要約: 制約最短経路問題(Constrained Shortest Path problem, C-SSP)は、特定の種類の運用制約下での環境における計画の定式化である。
この研究の最初の貢献は、Chance-Constrained Policyの正確な整数線型定式化である。
第三に、CC-SSP形式は、複数の時間ステップにまたがる制約を考慮するために一般化可能であることを示す。
- 参考スコア(独自算出の注目度): 3.655021726150368
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous vehicles face the problem of optimizing the expected performance
of subsequent maneuvers while bounding the risk of collision with surrounding
dynamic obstacles. These obstacles, such as agent vehicles, often exhibit
stochastic transitions that should be accounted for in a timely and safe
manner. The Constrained Stochastic Shortest Path problem (C-SSP) is a formalism
for planning in stochastic environments under certain types of operating
constraints. While C-SSP allows specifying constraints in the planning problem,
it does not allow for bounding the probability of constraint violation, which
is desired in safety-critical applications. This work's first contribution is
an exact integer linear programming formulation for Chance-constrained SSP
(CC-SSP) that attains deterministic policies. Second, a randomized rounding
procedure is presented for stochastic policies. Third, we show that the CC-SSP
formalism can be generalized to account for constraints that span through
multiple time steps. Evaluation results show the usefulness of our approach in
benchmark problems compared to existing approaches.
- Abstract(参考訳): 自動運転車は、周囲の動的障害物との衝突のリスクを制限しながら、その後の操作の期待性能を最適化する問題に直面している。
これらの障害物、例えばエージェント車両は、タイムリーで安全な方法で説明されるべき確率的遷移を示すことが多い。
制約付き確率的短経路問題(Constrained Stochastic Shortest Path problem, C-SSP)は、ある種の運用制約の下で確率的環境を計画するための形式主義である。
c-sspは計画問題の制約を指定できるが、安全クリティカルなアプリケーションで要求される制約違反の確率を制限することはできない。
本研究の最初の貢献は、確率制約付きssp (cc-ssp) に対する完全整数線形計画法である。
第二に、確率的政策のためにランダムな丸め手順が提示される。
第三に、CC-SSP形式は、複数の時間ステップにまたがる制約を考慮するために一般化可能であることを示す。
評価結果は,既存手法と比較してベンチマーク問題におけるアプローチの有用性を示した。
関連論文リスト
- Online Constraint Tightening in Stochastic Model Predictive Control: A
Regression Approach [49.056933332667114]
確率制約付き最適制御問題に対する解析解は存在しない。
制御中の制約強調パラメータをオンラインで学習するためのデータ駆動型アプローチを提案する。
提案手法は, 確率制約を厳密に満たす制約強調パラメータを導出する。
論文 参考訳(メタデータ) (2023-10-04T16:22:02Z) - Fully Stochastic Trust-Region Sequential Quadratic Programming for
Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。
アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文 参考訳(メタデータ) (2022-11-29T05:52:17Z) - Learning Stochastic Parametric Differentiable Predictive Control
Policies [2.042924346801313]
本稿では、ニューラルネットワークポリシーの教師なし学習のための、パラメトリック微分可能予測制御(SP-DPC)と呼ばれるスケーラブルな代替手法を提案する。
SP-DPCはパラメトリック制約最適制御問題に対する決定論的近似として定式化される。
閉ループ制約と確率満足度に関するSP-DPC法を用いて学習したポリシーに関する理論的確率的保証を提供する。
論文 参考訳(メタデータ) (2022-03-02T22:46:32Z) - Learning-based Preference Prediction for Constrained Multi-Criteria
Path-Planning [12.457788665461312]
自動地上車両(AGV)の制約された経路計画法はそのような適用例である。
我々は、ニューラルネットワークモデルをトレーニングして、オフラインシミュレーションによって得られた知識を活用し、不確実な基準を予測する。
私たちはこのモデルをパスプランナに統合し、オンラインの問題を解決することができます。
論文 参考訳(メタデータ) (2021-08-02T17:13:45Z) - Shortest-Path Constrained Reinforcement Learning for Sparse Reward Tasks [59.419152768018506]
最適ポリシーは必ずk-SP制約を満たすことを示す。
本研究では,SP制約に違反するポリシーを完全に排除する代わりに,新たなコスト関数を提案する。
また,MiniGrid,DeepMind Lab,Atari,Fetchを用いた実験の結果,提案手法はPPOを著しく改善することが示された。
論文 参考訳(メタデータ) (2021-07-13T21:39:21Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Trajectory Optimization of Chance-Constrained Nonlinear Stochastic
Systems for Motion Planning and Control [9.35511513240868]
本研究では、連続時間確率制約非線形最適制御問題(SNOC)に対する準最適解を求める。
提案手法は,不確実性下でのロボットシステムの動作計画と制御を可能にする。
論文 参考訳(メタデータ) (2021-06-05T05:15:05Z) - Rule-based Shielding for Partially Observable Monte-Carlo Planning [78.05638156687343]
一部観測可能なモンテカルロ計画(POMCP)への2つの貢献を提案する。
1つ目は、POMCPが選択した予期しない行動を、タスクのエキスパートの事前知識に関して識別する方法です。
2つ目は、POMCPが予期せぬ動作を選択するのを防ぐ遮蔽アプローチである。
我々は,pomdpsの標準ベンチマークであるtigerに対するアプローチと,移動ロボットナビゲーションにおける速度規制に関する実世界問題を評価する。
論文 参考訳(メタデータ) (2021-04-28T14:23:38Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z) - Cautious Reinforcement Learning via Distributional Risk in the Dual
Domain [45.17200683056563]
マルコフ決定過程(MDP)によって定義される強化学習問題において,状態と行動空間が可算有限である場合のリスク感受性ポリシーの推定について検討する。
本稿では,強化学習の線形プログラミング(LP)の2つの目的に付加されるペナルティ関数として,新たなリスク定義を提案する。
論文 参考訳(メタデータ) (2020-02-27T23:18:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。