論文の概要: STL Robustness Risk over Discrete-Time Stochastic Processes
- arxiv url: http://arxiv.org/abs/2104.01503v1
- Date: Sat, 3 Apr 2021 23:44:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 14:13:07.231442
- Title: STL Robustness Risk over Discrete-Time Stochastic Processes
- Title(参考訳): 離散時間確率過程におけるstlロバスト性リスク
- Authors: Lars Lindemann, Nikolai Matni, and George J. Pappas
- Abstract要約: 本稿では、信号時相論理(STL)の公式を誘導リスクの観点から離散時間プロセス上で解釈する枠組みを提案する。
STLの公式を満たしていないプロセスの「STL堅牢性リスク」と呼ばれるリスクを堅牢に定義します。
- 参考スコア(独自算出の注目度): 12.017448201296927
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a framework to interpret signal temporal logic (STL) formulas over
discrete-time stochastic processes in terms of the induced risk. Each
realization of a stochastic process either satisfies or violates an STL
formula. In fact, we can assign a robustness value to each realization that
indicates how robustly this realization satisfies an STL formula. We then
define the risk of a stochastic process not satisfying an STL formula robustly,
referred to as the "STL robustness risk". In our definition, we permit general
classes of risk measures such as, but not limited to, the value-at-risk. While
in general hard to compute, we propose an approximation of the STL robustness
risk. This approximation has the desirable property of being an upper bound of
the STL robustness risk when the chosen risk measure is monotone, a property
satisfied by most risk measures. Motivated by the interest in data-driven
approaches, we present a sampling-based method for calculating an upper bound
of the approximate STL robustness risk for the value-at-risk that holds with
high probability. While we consider the case of the value-at-risk, we highlight
that such sampling-based methods are viable for other risk measures.
- Abstract(参考訳): 本稿では,離散時間確率過程上の信号時相論理(stl)公式を誘導リスクの観点から解釈する枠組みを提案する。
確率過程のそれぞれの実現は、stl公式を満たすか、違反する。
実際、この実現がいかに強固にstl公式を満たすかを示す各実現にロバスト性値を割り当てることができる。
次に,STL式を頑健に満たさない確率過程のリスクを定義し,これを「STL頑健性リスク」と呼ぶ。
私たちの定義では、リスクアットリスクのようなリスク対策の一般的なクラスを許可します。
一般に計算は困難であるが,STLのロバスト性リスクの近似法を提案する。
この近似は、選択されたリスク尺度がモノトンである場合、STLロバスト性リスクの上限となることが望ましい性質を持つ。
データ駆動型アプローチに関心を抱き、高い確率で保持される値付きリスクに対する近似STLロバスト性リスクの上界を計算するサンプリングベース手法を提案する。
リスク価値の事例を考察する一方で,このようなサンプリングベースの手法は,他のリスク対策にも有効であることを強調する。
関連論文リスト
- Data-Adaptive Tradeoffs among Multiple Risks in Distribution-Free Prediction [55.77015419028725]
しきい値とトレードオフパラメータが適応的に選択された場合、リスクの有効な制御を可能にする手法を開発する。
提案手法は単調なリスクとほぼ単調なリスクをサポートするが,それ以外は分布的な仮定はしない。
論文 参考訳(メタデータ) (2024-03-28T17:28:06Z) - Physics-informed RL for Maximal Safety Probability Estimation [0.8287206589886881]
本研究では,リスクのある状態や長期軌道からのサンプルを十分にカバーすることなく,最大安全行動の長期安全確率を推定する方法を検討する。
提案手法は,短期サンプルを用いて長期リスクを推定し,未サンプリング状態のリスクを推定する。
論文 参考訳(メタデータ) (2024-03-25T03:13:56Z) - Provable Risk-Sensitive Distributional Reinforcement Learning with
General Function Approximation [54.61816424792866]
本稿では,リスク感性分布強化学習(RS-DisRL)と静的リプシッツリスク対策(LRM),一般関数近似について紹介する。
モデルに基づく関数近似のためのモデルベース戦略であるtextttRS-DisRL-M と、一般値関数近似のためのモデルフリーアプローチである textttRS-DisRL-V の2つの革新的なメタアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-02-28T08:43:18Z) - Safe Deployment for Counterfactual Learning to Rank with Exposure-Based
Risk Minimization [63.93275508300137]
本稿では,安全な配置を理論的に保証する新たなリスク認識型対実学習ランク法を提案する。
提案手法の有効性を実験的に検証し,データが少ない場合の動作不良の早期回避に有効であることを示す。
論文 参考訳(メタデータ) (2023-04-26T15:54:23Z) - RASR: Risk-Averse Soft-Robust MDPs with EVaR and Entropic Risk [28.811725782388688]
本研究では,有限水平および割引無限水平MDPにおける不確実性に関連するリスクを共同でモデル化する新しい枠組みを提案し,分析する。
リスク回避をEVaRかエントロピーリスクのいずれかを用いて定義すると、RASRの最適ポリシーは時間依存型リスクレベルを持つ新しい動的プログラム定式化を用いて効率的に計算できることを示す。
論文 参考訳(メタデータ) (2022-09-09T00:34:58Z) - Efficient Risk-Averse Reinforcement Learning [79.61412643761034]
リスク逆強化学習(RL)では、リターンのリスク測定を最適化することが目標である。
特定の条件下では、これは必然的に局所最適障壁につながることを証明し、それを回避するためのソフトリスク機構を提案する。
迷路ナビゲーション,自律運転,資源配分ベンチマークにおいて,リスク回避の改善を示す。
論文 参考訳(メタデータ) (2022-05-10T19:40:52Z) - A Full Characterization of Excess Risk via Empirical Risk Landscape [8.797852602680445]
本稿では,滑らかな凸関数と非損失関数の両方を持つ固有アルゴリズムにより訓練されたモデルのリスクを統一的に解析する。
論文 参考訳(メタデータ) (2020-12-04T08:24:50Z) - Risk-Constrained Thompson Sampling for CVaR Bandits [82.47796318548306]
CVaR(Conditional Value at Risk)として知られる量的ファイナンスにおける一般的なリスク尺度について考察する。
本稿では,トンプソンサンプリングに基づくCVaR-TSアルゴリズムの性能について検討する。
論文 参考訳(メタデータ) (2020-11-16T15:53:22Z) - Learning Bounds for Risk-sensitive Learning [86.50262971918276]
リスクに敏感な学習では、損失のリスク・アバース(またはリスク・シーキング)を最小化する仮説を見つけることを目的としている。
最適化された確実性等価性によって最適性を記述するリスク感応学習スキームの一般化特性について検討する。
論文 参考訳(メタデータ) (2020-06-15T05:25:02Z) - A Stochastic Subgradient Method for Distributionally Robust Non-Convex
Learning [2.007262412327553]
堅牢性は、基礎となるデータ分布の不確実性に関するものです。
本手法は摂動条件を満たすことに収束することを示す。
また、実際のデータセット上でのアルゴリズムの性能についても解説する。
論文 参考訳(メタデータ) (2020-06-08T18:52:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。