論文の概要: Optimizing Sharpe Ratio: Risk-Adjusted Decision-Making in Multi-Armed Bandits
- arxiv url: http://arxiv.org/abs/2406.06552v1
- Date: Tue, 28 May 2024 14:24:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-23 13:55:28.393652
- Title: Optimizing Sharpe Ratio: Risk-Adjusted Decision-Making in Multi-Armed Bandits
- Title(参考訳): シャープ比の最適化:マルチアーマッドバンドにおけるリスク調整型意思決定
- Authors: Sabrina Khurshid, Mohammed Shahid Abdulla, Gourab Ghatak,
- Abstract要約: 我々は、シャープ比(SR)が金融時系列の特徴付けにおける重要なパラメータであると考えている。
我々は、レギュレット最小化(RM)とBest Arm Identification(BAI)のために、UCB-RSSRと呼ばれるSRを最適化する新しいアルゴリズムを提案する。
UCB-RSSRは、他のSR最適化バンディットアルゴリズムであるU-UCB Cassel et al(2023)よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 3.5502600490147196
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Sharpe Ratio (SR) is a critical parameter in characterizing financial time series as it jointly considers the reward and the volatility of any stock/portfolio through its variance. Deriving online algorithms for optimizing the SR is particularly challenging since even offline policies experience constant regret with respect to the best expert Even-Dar et al (2006). Thus, instead of optimizing the usual definition of SR, we optimize regularized square SR (RSSR). We consider two settings for the RSSR, Regret Minimization (RM) and Best Arm Identification (BAI). In this regard, we propose a novel multi-armed bandit (MAB) algorithm for RM called UCB-RSSR for RSSR maximization. We derive a path-dependent concentration bound for the estimate of the RSSR. Based on that, we derive the regret guarantees of UCB-RSSR and show that it evolves as O(log n) for the two-armed bandit case played for a horizon n. We also consider a fixed budget setting for well-known BAI algorithms, i.e., sequential halving and successive rejects, and propose SHVV, SHSR, and SuRSR algorithms. We derive the upper bound for the error probability of all proposed BAI algorithms. We demonstrate that UCB-RSSR outperforms the only other known SR optimizing bandit algorithm, U-UCB Cassel et al (2023). We also establish its efficacy with respect to other benchmarks derived from the GRA-UCB and MVTS algorithms. We further demonstrate the performance of proposed BAI algorithms for multiple different setups. Our research highlights that our proposed algorithms will find extensive applications in risk-aware portfolio management problems. Consequently, our research highlights that our proposed algorithms will find extensive applications in risk-aware portfolio management problems.
- Abstract(参考訳): シャープ比率(SR)は金融時系列の特徴付けにおいて重要なパラメータであり、変動を通じて株/ポートフォリオの報酬とボラティリティを共同で検討している。
最高の専門家であるEven-Dar et al (2006)に対して、オフラインポリシーでさえ常に後悔を経験しているため、SRを最適化するためのオンラインアルゴリズムの導出は特に困難である。
したがって、通常の SR の定義を最適化する代わりに、正規化された正方形 SR (RSSR) を最適化する。
RSSRの2つの設定、Regret Minimization(RM)とBest Arm Identification(BAI)について検討する。
そこで本研究では,UCB-RSSR と呼ばれる RM の RSSR 最大化のための新しいマルチアーム・バンディット (MAB) アルゴリズムを提案する。
RSSRの推定値に対して経路依存濃度を導出する。
このことから, UCB-RSSR の反証を導出し, 水平 n で演奏される二本腕のバンディットケースの O(log n) として進化することを示す。
また、よく知られたBAIアルゴリズム、すなわちシーケンシャル半減と逐次リジェクションの固定予算設定も検討し、SHVV、SHSR、SuRSRアルゴリズムを提案する。
提案した全てのBAIアルゴリズムの誤差確率の上限を導出する。
UCB-RSSRは、他のSR最適化バンディットアルゴリズムであるU-UCB Cassel et al(2023)よりも優れていることを示す。
また, GRA-UCB および MVTS アルゴリズムから得られた他のベンチマークに対して有効性を確立する。
さらに、複数の異なる設定に対して提案したBAIアルゴリズムの性能を実証する。
我々の研究は、提案アルゴリズムがリスク対応ポートフォリオ管理問題に広範な応用を見出すことを強調している。
その結果,提案アルゴリズムはリスク対応ポートフォリオ管理問題に広範な応用が期待できることがわかった。
関連論文リスト
- Best Arm Identification for Stochastic Rising Bandits [84.55453174601826]
SRB(Rising Bandits)は、選択される度に選択肢の期待される報酬が増加する、シーケンシャルな意思決定の問題をモデル化する。
本稿では,SRBの固定予算ベストアーム識別(BAI)問題に焦点をあてる。
R-UCBE と R-SR の2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-15T08:01:37Z) - Contextual bandits with concave rewards, and an application to fair
ranking [108.48223948875685]
CBCR (Contextual Bandits with Concave Rewards) に対する反省点のある最初のアルゴリズムを提案する。
我々は,スカラー・リワード問題に対するCBCRの後悔から,新たな縮小を導出した。
推薦の公正さによって動機づけられたCBCRの特別事例として,ランク付けと公正を意識した目的について述べる。
論文 参考訳(メタデータ) (2022-10-18T16:11:55Z) - Risk-Aware Linear Bandits: Theory and Applications in Smart Order
Routing [10.69955834942979]
スマート・オーダー・ルーティング(SOR)におけるリスク・アウェア・バンディットの最適化について検討する。
分散最小化グローバル最適化(G-Optimal)設計により、新しいインスタンス非依存型リスク意識探索-then-Commit(RISE)アルゴリズムとインスタンス依存型リスク意識継承排除(RISE++)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-04T00:21:10Z) - Safe Online Bid Optimization with Return-On-Investment and Budget
Constraints subject to Uncertainty [87.81197574939355]
最適化問題と学習問題の両方について検討する。
我々は、潜在的に線形な数の制約違反を犠牲にして、サブ線形後悔を保証するアルゴリズム、すなわちGCBを提供する。
より興味深いことに、我々はGCB_safe(psi,phi)というアルゴリズムを提供し、サブ線形擬似回帰と安全性w.h.p.の両方を、耐性 psi と phi を受け入れるコストで保証する。
論文 参考訳(メタデータ) (2022-01-18T17:24:20Z) - Risk-Constrained Thompson Sampling for CVaR Bandits [82.47796318548306]
CVaR(Conditional Value at Risk)として知られる量的ファイナンスにおける一般的なリスク尺度について考察する。
本稿では,トンプソンサンプリングに基づくCVaR-TSアルゴリズムの性能について検討する。
論文 参考訳(メタデータ) (2020-11-16T15:53:22Z) - Large-Scale Methods for Distributionally Robust Optimization [53.98643772533416]
我々のアルゴリズムは、トレーニングセットのサイズとパラメータの数によらず、多くの評価勾配を必要とすることを証明している。
MNIST と ImageNet の実験により,本手法の 9-36 倍の効率性を持つアルゴリズムの理論的スケーリングが確認された。
論文 参考訳(メタデータ) (2020-10-12T17:41:44Z) - Thompson Sampling Algorithms for Mean-Variance Bandits [97.43678751629189]
我々は平均分散MABのためのトンプソンサンプリング型アルゴリズムを開発した。
我々はまた、ガウシアンとベルヌーイの盗賊に対する包括的後悔の分析も提供する。
我々のアルゴリズムは、全てのリスク許容度に対して既存のLCBベースのアルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2020-02-01T15:33:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。