論文の概要: Robust Utility Optimization via a GAN Approach
- arxiv url: http://arxiv.org/abs/2403.15243v1
- Date: Fri, 22 Mar 2024 14:36:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 17:09:34.192259
- Title: Robust Utility Optimization via a GAN Approach
- Title(参考訳): GANアプローチによるロバストなユーティリティ最適化
- Authors: Florian Krach, Josef Teichmann, Hanna Wutte,
- Abstract要約: 本稿では,堅牢なユーティリティ最適化問題を解決するために,GAN(Generative Adversarial Network)アプローチを提案する。
特に、投資家と市場の両方をニューラルネットワーク(NN)でモデル化し、ミニマックスゼロサムゲームでトレーニングする。
- 参考スコア(独自算出の注目度): 3.74142789780782
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Robust utility optimization enables an investor to deal with market uncertainty in a structured way, with the goal of maximizing the worst-case outcome. In this work, we propose a generative adversarial network (GAN) approach to (approximately) solve robust utility optimization problems in general and realistic settings. In particular, we model both the investor and the market by neural networks (NN) and train them in a mini-max zero-sum game. This approach is applicable for any continuous utility function and in realistic market settings with trading costs, where only observable information of the market can be used. A large empirical study shows the versatile usability of our method. Whenever an optimal reference strategy is available, our method performs on par with it and in the (many) settings without known optimal strategy, our method outperforms all other reference strategies. Moreover, we can conclude from our study that the trained path-dependent strategies do not outperform Markovian ones. Lastly, we uncover that our generative approach for learning optimal, (non-) robust investments under trading costs generates universally applicable alternatives to well known asymptotic strategies of idealized settings.
- Abstract(参考訳): ロバストなユーティリティ最適化により、投資家は最悪の結果の最大化を目標として、構造化された方法で市場の不確実性に対処できる。
本研究では,GAN(Generative Adversarial Network)アプローチを用いて,汎用的かつ現実的な設定において,堅牢なユーティリティ最適化問題を(ほぼ)解決する手法を提案する。
特に、投資家と市場の両方をニューラルネットワーク(NN)でモデル化し、ミニマックスゼロサムゲームでトレーニングする。
このアプローチは、継続的なユーティリティ機能や、市場の可観測情報のみを使用する取引コストを伴う現実的な市場設定に適用できる。
大規模な実証実験により,本手法の汎用性を示した。
最適な参照戦略が利用可能であればいつでも,メソッドはそれと同等に動作し,かつ,既知の最適戦略のない(多くの)設定では,他の参照戦略よりも優れています。
さらに,本研究から,訓練された経路依存戦略がマルコフ戦略を上回るものではないと結論付けることができる。
最後に、取引コストに対する(非)ロバストな投資を最適に学習するための我々の生成的アプローチが、理想化された設定のよく知られた漸近的戦略に対して、普遍的に適用可能な代替手段を生み出していることを明らかにする。
関連論文リスト
- Optimising Calls to Large Language Models with Uncertainty-Based Two-Tier Selection [80.63946798650653]
決定は、より優れた性能を持つ大型LCMを使うか、より少ないコストで使用するかに重点を置いている。
我々は,LLMの世代間不確実性のみを意思決定基準として,より単純な解を提案する。
実験の結果、この単純な解はコストと性能を最適にバランスさせ、27の試験装置中25の既存手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-05-03T14:38:59Z) - End-to-End Learning for Fair Multiobjective Optimization Under
Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。
本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。
この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:33:35Z) - Onflow: an online portfolio allocation algorithm [0.0]
ポートフォリオ割り当てポリシーのオンライン最適化を可能にする強化学習手法であるOnflowを紹介する。
ログ正規資産の場合、トランザクションコストがゼロのOnflowが学んだ戦略は、Markowitzの最適ポートフォリオを模倣している。
オンフローは、他の動的アロケーション技術がもはや機能しないレギュレーションにおいて、効率的であり続けることができる。
論文 参考訳(メタデータ) (2023-12-08T16:49:19Z) - Rate-Optimal Policy Optimization for Linear Markov Decision Processes [71.65874793547107]
最安値の$widetilde O (sqrt K)$ regret, $K$はエピソード数を表す。
我々の研究は、バンディットフィードバックのある設定において最適な収束率(w.r.t.$K$)を確立する最初のものである。
現在、最適なレート保証を持つアルゴリズムは知られていない。
論文 参考訳(メタデータ) (2023-08-28T15:16:09Z) - Reinforcement Learning for Credit Index Option Hedging [2.568904868787359]
本稿では,強化学習を用いたクレジットインデックスオプションの最適ヘッジ戦略の探索に焦点をあてる。
実践的なアプローチでは、離散時間、トランザクションコスト、実際の市場データに対するポリシーのテストなど、リアリズムに重点を置いています。
論文 参考訳(メタデータ) (2023-07-19T09:03:41Z) - Asset Allocation: From Markowitz to Deep Reinforcement Learning [2.0305676256390934]
資産配分とは、ポートフォリオの資産を常に再分配することでリスクと報酬のバランスをとることを目的とした投資戦略である。
我々は、多くの最適化手法の有効性と信頼性を決定するために、広範囲なベンチマーク研究を行う。
論文 参考訳(メタデータ) (2022-07-14T14:44:04Z) - Understanding the Effect of Stochasticity in Policy Optimization [86.7574122154668]
最適化手法の優位性は、正確な勾配が用いられるかどうかに大きく依存することを示す。
次に,政策最適化におけるコミット率の概念を紹介する。
第三に、外部のオラクル情報がない場合には、収束を加速するために幾何を利用することと、最適性をほぼ確実に達成することとの間に本質的にトレードオフがあることが示される。
論文 参考訳(メタデータ) (2021-10-29T06:35:44Z) - Universal Trading for Order Execution with Oracle Policy Distillation [99.57416828489568]
本稿では,不完全な市場状態と注文実行のための最適な行動シーケンスとのギャップを埋める,新たなユニバーサル取引ポリシー最適化フレームワークを提案する。
本研究の枠組みは,完全情報を持つ託宣教師による実践的最適実行に向けて,共通政策の学習を指導する上で有効であることを示す。
論文 参考訳(メタデータ) (2021-01-28T05:52:18Z) - Deep Portfolio Optimization via Distributional Prediction of Residual
Factors [3.9189409002585562]
そこで本稿では,残余要因と呼ばれる金融量分布の予測に基づくポートフォリオ構築手法を提案する。
本手法が米国および日本の株式市場データに有効であることを実証する。
論文 参考訳(メタデータ) (2020-12-14T04:09:52Z) - Deep Deterministic Portfolio Optimization [0.0]
この研究は、概念的には単純だが数学的には非自明なトレーディング環境上で強化学習アルゴリズムをテストすることである。
本研究では, 決定論的政策勾配アルゴリズムを深く研究し, このような強化学習エージェントが, 最適取引戦略の本質的特徴を回復できることを示す。
論文 参考訳(メタデータ) (2020-03-13T22:20:21Z) - Mixed Strategies for Robust Optimization of Unknown Objectives [93.8672371143881]
そこでは,不確実なパラメータの最悪の実現に対して,未知の目的関数を最適化することを目的として,ロバストな最適化問題を考察する。
我々は,未知の目的をノイズ点評価から逐次学習する,新しいサンプル効率アルゴリズムGP-MROを設計する。
GP-MROは、最悪のケースで期待される目標値を最大化する、堅牢でランダムな混合戦略の発見を目指している。
論文 参考訳(メタデータ) (2020-02-28T09:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。