論文の概要: Risk regularization through bidirectional dispersion
- arxiv url: http://arxiv.org/abs/2203.14434v1
- Date: Mon, 28 Mar 2022 01:13:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 13:38:48.432226
- Title: Risk regularization through bidirectional dispersion
- Title(参考訳): 双方向分散によるリスク正則化
- Authors: Matthew J. Holland
- Abstract要約: リスク」という別の概念の多くは、少なくとも上面の尾翼を失う平均よりも敏感であり、下面の偏差を無視する傾向がある。
本研究では,損失偏差を双方向に補償する新たなリスククラスについて検討する。
- 参考スコア(独自算出の注目度): 9.36599317326032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many alternative notions of "risk" (e.g., CVaR, entropic risk, DRO risk) have
been proposed and studied, but these risks are all at least as sensitive as the
mean to loss tails on the upside, and tend to ignore deviations on the
downside. In this work, we study a complementary new risk class that penalizes
loss deviations in a bidirectional manner, while having more flexibility in
terms of tail sensitivity than is offered by classical mean-variance, without
sacrificing computational or analytical tractability.
- Abstract(参考訳): 多くの「リスク」の概念(CVaR、エントロピーリスク、DROリスクなど)が提案され研究されているが、これらのリスクは少なくとも上面の尾を失う平均値と同じくらい敏感であり、下面の偏差を無視する傾向にある。
本研究では,従来の平均分散よりもテール感度の柔軟性が高く,計算や解析の容易性を犠牲にすることなく,双方向的に損失偏差を罰する新たなリスククラスについて検討した。
関連論文リスト
- Data-Adaptive Tradeoffs among Multiple Risks in Distribution-Free Prediction [55.77015419028725]
しきい値とトレードオフパラメータが適応的に選択された場合、リスクの有効な制御を可能にする手法を開発する。
提案手法は単調なリスクとほぼ単調なリスクをサポートするが,それ以外は分布的な仮定はしない。
論文 参考訳(メタデータ) (2024-03-28T17:28:06Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - An Alternative to Variance: Gini Deviation for Risk-averse Policy
Gradient [35.01235012813407]
政策の回帰の分散を制限することは、リスク回避強化学習において一般的な選択である。
最近の手法では、プロキシとしてのステップごとの報酬分散が制限されている。
代替リスク尺度であるGini deviation を代替として用いることを提案する。
論文 参考訳(メタデータ) (2023-07-17T22:08:27Z) - Prediction Risk and Estimation Risk of the Ridgeless Least Squares Estimator under General Assumptions on Regression Errors [10.857775300638831]
より一般的な回帰誤差仮定の下で予測リスクと推定リスクについて検討する。
その結果,パラメータ化の利点は時系列,パネル,グループ化データにまで拡張できることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T10:04:20Z) - One Risk to Rule Them All: A Risk-Sensitive Perspective on Model-Based
Offline Reinforcement Learning [25.218430053391884]
両問題に共同で対処するためのメカニズムとしてリスク感受性を提案する。
相対的不確実性へのリスク回避は、環境に悪影響を及ぼす可能性のある行動を妨げる。
実験の結果,提案アルゴリズムは決定論的ベンチマーク上での競合性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-11-30T21:24:11Z) - Efficient Risk-Averse Reinforcement Learning [79.61412643761034]
リスク逆強化学習(RL)では、リターンのリスク測定を最適化することが目標である。
特定の条件下では、これは必然的に局所最適障壁につながることを証明し、それを回避するためのソフトリスク機構を提案する。
迷路ナビゲーション,自律運転,資源配分ベンチマークにおいて,リスク回避の改善を示す。
論文 参考訳(メタデータ) (2022-05-10T19:40:52Z) - A Manifold View of Adversarial Risk [23.011667845523267]
本研究は,2種類の新しい対向リスク,通常の方向に沿った摂動による通常の対向リスク,多様体内の摂動による対向リスクについて検討する。
通常のリスクと人的リスクの両方がゼロであっても、標準的な敵のリスクはゼロである可能性があるという悲観的なケースを示します。
論文 参考訳(メタデータ) (2022-03-24T18:11:21Z) - PAC$^m$-Bayes: Narrowing the Empirical Risk Gap in the Misspecified
Bayesian Regime [75.19403612525811]
この研究は、2つのリスク間のトレードオフを分散することでギャップを埋めることのできるマルチサンプル損失を開発する。
実証的研究は予測分布の改善を示す。
論文 参考訳(メタデータ) (2020-10-19T16:08:34Z) - The Risks of Invariant Risk Minimization [52.7137956951533]
不変リスク最小化(Invariant Risk Minimization)は、データの深い不変性を学ぶという考え方に基づく目標である。
我々は、IRMの目的に基づく分類の最初の分析と、最近提案されたこれらの代替案について、かなり自然で一般的なモデルで分析する。
IRMは、テストデータがトレーニング分布と十分に類似していない限り、破滅的に失敗する可能性がある。
論文 参考訳(メタデータ) (2020-10-12T14:54:32Z) - Learning Bounds for Risk-sensitive Learning [86.50262971918276]
リスクに敏感な学習では、損失のリスク・アバース(またはリスク・シーキング)を最小化する仮説を見つけることを目的としている。
最適化された確実性等価性によって最適性を記述するリスク感応学習スキームの一般化特性について検討する。
論文 参考訳(メタデータ) (2020-06-15T05:25:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。