論文の概要: Optimal Best-Arm Identification Methods for Tail-Risk Measures
- arxiv url: http://arxiv.org/abs/2008.07606v3
- Date: Tue, 22 Jun 2021 00:58:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 03:07:40.962857
- Title: Optimal Best-Arm Identification Methods for Tail-Risk Measures
- Title(参考訳): テールリスク測度の最適最適最適アーム同定法
- Authors: Shubhada Agrawal, Wouter M. Koolen, Sandeep Juneja
- Abstract要約: 条件付きバリュー・アット・リスク(CVaR)とバリュー・アット・リスク(VaR)は金融や保険業界で人気のあるテール・アット・リスク対策である。
CVaR, VaR, CVaRの最小値の平均は, CVaR, VaR, CVaRの最小値の平均である。
- 参考スコア(独自算出の注目度): 9.128264779870538
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conditional value-at-risk (CVaR) and value-at-risk (VaR) are popular
tail-risk measures in finance and insurance industries as well as in highly
reliable, safety-critical uncertain environments where often the underlying
probability distributions are heavy-tailed. We use the multi-armed bandit
best-arm identification framework and consider the problem of identifying the
arm from amongst finitely many that has the smallest CVaR, VaR, or weighted sum
of CVaR and mean. The latter captures the risk-return trade-off common in
finance. Our main contribution is an optimal $\delta$-correct algorithm that
acts on general arms, including heavy-tailed distributions, and matches the
lower bound on the expected number of samples needed, asymptotically (as
$\delta$ approaches $0$). The algorithm requires solving a non-convex
optimization problem in the space of probability measures, that requires
delicate analysis. En-route, we develop new non-asymptotic empirical
likelihood-based concentration inequalities for tail-risk measures which are
tighter than those for popular truncation-based empirical estimators.
- Abstract(参考訳): cvar(conditional value-at-risk)やvar(value-at-risk)は、金融や保険業界や信頼性が高く、安全性に批判的な不確実性のある環境において一般的なテールリスク対策である。
我々は、多腕バンディットのベストアーム識別フレームワークを使用し、CVaR、VaR、またはCVaR、平均の重み付け和を持つ有限個の腕から腕を識別する問題を考察する。
後者は金融に共通するリスク・リターンのトレードオフを捉えている。
我々の主な貢献は、重い尾の分布を含む一般の腕に作用する最適な$\delta$-correctアルゴリズムであり、漸近的に($\delta$が$0$となるように)必要なサンプル数の下限に一致します。
このアルゴリズムは、厳密な解析を必要とする確率測度の空間における非凸最適化問題を解く必要がある。
提案手法は, 一般的なトランケーションに基づく経験的推定値よりも厳密なテールリスク尺度に対する非漸近的経験的可能性に基づく新しい濃度不等式を開発する。
関連論文リスト
- Data-driven decision-making under uncertainty with entropic risk measure [5.407319151576265]
エントロピーリスク尺度は、不確実な損失に関連する尾のリスクを考慮に入れた高い意思決定に広く用いられている。
経験的エントロピーリスク推定器を劣化させるため, 強く一貫したブートストラップ手法を提案する。
検証性能のバイアスが補正されない場合,クロスバリデーション手法は,保険業者のアウト・オブ・サンプルリスクを著しく高める可能性があることを示す。
論文 参考訳(メタデータ) (2024-09-30T04:02:52Z) - Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Risk-aware linear bandits with convex loss [0.0]
提案手法は, 線形帯域幅の一般化に類似した, 最適リスク認識動作を学習するための楽観的 UCB アルゴリズムを提案する。
このアプローチではアルゴリズムの各ラウンドで凸問題を解く必要があり、オンライン勾配降下法によって得られる近似解のみを許すことで緩和することができる。
論文 参考訳(メタデータ) (2022-09-15T09:09:53Z) - Tailoring to the Tails: Risk Measures for Fine-Grained Tail Sensitivity [10.482805367361818]
予測されるリスクアレンジメント(ERM)は、マシンラーニングシステムの中核にある。
本稿では,所望のテール感度を示すリスク対策を構築するための一般的な手法を提案する。
論文 参考訳(メタデータ) (2022-08-05T09:51:18Z) - Probable Domain Generalization via Quantile Risk Minimization [90.15831047587302]
ドメインの一般化は、目に見えないテスト分布でうまく機能する予測子を求める。
我々はDGのための新しい確率的フレームワークを提案し、高い確率でよく動作する予測器を学習することを目指している。
論文 参考訳(メタデータ) (2022-07-20T14:41:09Z) - Risk-Constrained Thompson Sampling for CVaR Bandits [82.47796318548306]
CVaR(Conditional Value at Risk)として知られる量的ファイナンスにおける一般的なリスク尺度について考察する。
本稿では,トンプソンサンプリングに基づくCVaR-TSアルゴリズムの性能について検討する。
論文 参考訳(メタデータ) (2020-11-16T15:53:22Z) - Large-Scale Methods for Distributionally Robust Optimization [53.98643772533416]
我々のアルゴリズムは、トレーニングセットのサイズとパラメータの数によらず、多くの評価勾配を必要とすることを証明している。
MNIST と ImageNet の実験により,本手法の 9-36 倍の効率性を持つアルゴリズムの理論的スケーリングが確認された。
論文 参考訳(メタデータ) (2020-10-12T17:41:44Z) - Statistically Robust, Risk-Averse Best Arm Identification in Multi-Armed
Bandits [4.760079434948198]
このようなパラメトリック情報を利用する特殊なアルゴリズムは、パラメータが誤って特定された場合、不整合学習性能が高いことを示す。
主な貢献は, (i) 固定予算純探索条件下で統計的に堅牢なMABアルゴリズムの基本的な性能限界を確立すること, (ii) 二つの近似アルゴリズムのクラスを提案することである。
論文 参考訳(メタデータ) (2020-08-28T13:43:12Z) - Sharp Statistical Guarantees for Adversarially Robust Gaussian
Classification [54.22421582955454]
逆向きに頑健な分類の過剰リスクに対する最適ミニマックス保証の最初の結果を提供する。
結果はAdvSNR(Adversarial Signal-to-Noise Ratio)の項で述べられており、これは標準的な線形分類と逆数設定との類似の考え方を一般化している。
論文 参考訳(メタデータ) (2020-06-29T21:06:52Z) - Constrained regret minimization for multi-criterion multi-armed bandits [5.349852254138086]
リスク制約を条件として,所与の時間的地平線上での後悔の最小化の問題について検討する。
本稿では,対数的後悔を保証するリスク制約付き低信頼境界アルゴリズムを提案する。
我々は,リスク制約付き後悔最小化アルゴリズムの性能に低い限界を証明した。
論文 参考訳(メタデータ) (2020-06-17T04:23:18Z) - Thompson Sampling Algorithms for Mean-Variance Bandits [97.43678751629189]
我々は平均分散MABのためのトンプソンサンプリング型アルゴリズムを開発した。
我々はまた、ガウシアンとベルヌーイの盗賊に対する包括的後悔の分析も提供する。
我々のアルゴリズムは、全てのリスク許容度に対して既存のLCBベースのアルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2020-02-01T15:33:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。