論文の概要: Fast Deep Hedging with Second-Order Optimization
- arxiv url: http://arxiv.org/abs/2410.22568v1
- Date: Tue, 29 Oct 2024 22:17:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-31 14:25:59.718572
- Title: Fast Deep Hedging with Second-Order Optimization
- Title(参考訳): 2次最適化による高速ディープヘッジ
- Authors: Konrad Mueller, Amira Akkari, Lukas Gonon, Ben Wood,
- Abstract要約: 市場の摩擦がある場合にエキゾチックな選択肢を取り入れることは、重要なリスク管理課題である。
本稿では,ディープヘッジのための2次最適化手法を提案する。
提案手法は,標準適応モーメントベース最適化の要するステップ数のうち,1/4でポリシーを最適化できる。
- 参考スコア(独自算出の注目度): 1.6874375111244329
- License:
- Abstract: Hedging exotic options in presence of market frictions is an important risk management task. Deep hedging can solve such hedging problems by training neural network policies in realistic simulated markets. Training these neural networks may be delicate and suffer from slow convergence, particularly for options with long maturities and complex sensitivities to market parameters. To address this, we propose a second-order optimization scheme for deep hedging. We leverage pathwise differentiability to construct a curvature matrix, which we approximate as block-diagonal and Kronecker-factored to efficiently precondition gradients. We evaluate our method on a challenging and practically important problem: hedging a cliquet option on a stock with stochastic volatility by trading in the spot and vanilla options. We find that our second-order scheme can optimize the policy in 1/4 of the number of steps that standard adaptive moment-based optimization takes.
- Abstract(参考訳): 市場の摩擦がある場合にエキゾチックな選択肢を取り入れることは、重要なリスク管理課題である。
ディープヘッジは、現実的なシミュレートされた市場でニューラルネットワークポリシーをトレーニングすることで、そのようなヘッジの問題を解決することができる。
これらのニューラルネットワークのトレーニングは繊細で、特に市場のパラメータに長い成熟度と複雑な感受性を持つオプションでは、収束が遅い。
そこで本研究では,ディープヘッジのための2次最適化手法を提案する。
経路微分可能性を利用して曲率行列を構築し、ブロック対角行列とクロネッカー因子を近似して効率的にプレコンディション勾配を求める。
我々は,この手法を,スポット内取引による確率的ボラティリティとバニラオプションによる株価のクリケットオプションのヘッジという,困難かつ実用的に重要な問題に対して評価する。
標準適応モーメントベース最適化の手順の1/4で、我々の2次スキームがポリシーを最適化できることが分かりました。
関連論文リスト
- Deep Reinforcement Learning for Online Optimal Execution Strategies [49.1574468325115]
本稿では,動的な金融市場における非マルコフ的最適実行戦略の学習に挑戦する。
我々は,Deep Deterministic Policy Gradient(DDPG)に基づく新しいアクター批判アルゴリズムを提案する。
提案アルゴリズムは最適実行戦略の近似に成功していることを示す。
論文 参考訳(メタデータ) (2024-10-17T12:38:08Z) - A Stochastic Approach to Bi-Level Optimization for Hyperparameter Optimization and Meta Learning [74.80956524812714]
我々は,現代のディープラーニングにおいて広く普及している一般的なメタ学習問題に対処する。
これらの問題は、しばしばBi-Level Optimizations (BLO)として定式化される。
我々は,与えられたBLO問題を,内部損失関数が滑らかな分布となり,外損失が内部分布に対する期待損失となるようなii最適化に変換することにより,新たな視点を導入する。
論文 参考訳(メタデータ) (2024-10-14T12:10:06Z) - Accelerated First-Order Optimization under Nonlinear Constraints [73.2273449996098]
我々は、制約付き最適化のための一階アルゴリズムと非滑らかなシステムの間で、新しい一階アルゴリズムのクラスを設計する。
これらのアルゴリズムの重要な性質は、制約がスパース変数の代わりに速度で表されることである。
論文 参考訳(メタデータ) (2023-02-01T08:50:48Z) - Optimal Parameter-free Online Learning with Switching Cost [47.415099037249085]
オンライン学習における自由とは、後ろ向きの最適決定に対するアルゴリズムの適応性を指す。
本稿では,パラメータフリーで要求される楽観的な更新を,スイッチングコストを前提として,そのようなアルゴリズムを設計する。
本稿では,オンライン線形最適化 (OLO) のための簡易かつ強力なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-13T18:44:27Z) - On Parametric Optimal Execution and Machine Learning Surrogates [3.077531983369872]
本研究では,短時間の価格変動とレジリエンスを考慮した離散時間における最適順序実行問題について検討する。
動的プログラミングとディープラーニングに基づく数値アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-04-18T22:40:14Z) - Chance-Constrained Optimization in Contact-Rich Systems for Robust
Manipulation [13.687891070512828]
離散時間線形相補性システム(SDLCS)の確率制約最適化を提案する。
我々の定式化では、相補性に対する合同確率制約と、ダイナミクスの進化を捉える状態について明確に検討する。
このロバスト性はSDLCSのロバストな軌道最適化に対する最近の手法よりも優れている。
論文 参考訳(メタデータ) (2022-03-05T00:16:22Z) - Local Quadratic Convergence of Stochastic Gradient Descent with Adaptive
Step Size [29.15132344744801]
本研究では,行列逆変換などの問題に対して,適応的なステップサイズを持つ勾配勾配の局所収束性を確立する。
これらの一階最適化法は線形あるいは線形収束を実現することができることを示す。
論文 参考訳(メタデータ) (2021-12-30T00:50:30Z) - Adaptivity and Non-stationarity: Problem-dependent Dynamic Regret for Online Convex Optimization [70.4342220499858]
本稿では,スムーズさを生かし,問題依存量による動的後悔のT$への依存を補う新しいオンラインアルゴリズムを提案する。
この結果が本質的な難易度に適応しているのは, 既往の結果よりも厳密であり, 最悪の場合, 同一レートの保護が可能であるからである。
論文 参考訳(メタデータ) (2021-12-29T02:42:59Z) - On Constraints in First-Order Optimization: A View from Non-Smooth
Dynamical Systems [99.59934203759754]
本稿では,スムーズな制約付き最適化のための一階法について紹介する。
提案手法の2つの特徴は、実現可能な集合全体の投影や最適化が避けられることである。
結果として得られるアルゴリズムの手順は、制約が非線形であっても簡単に実装できる。
論文 参考訳(メタデータ) (2021-07-17T11:45:13Z) - SOAC: The Soft Option Actor-Critic Architecture [25.198302636265286]
低レベルのオプション内ポリシーと高レベルのオプション選択ポリシーを同時に学習する手法が提案されている。
既存の手法は通常、非効率な探索と不安定な更新という2つの大きな課題に悩まされる。
これらの課題に対処するために、最大エントロピーモデルに基づく、新しく安定した非政治的アプローチを提案する。
論文 参考訳(メタデータ) (2020-06-25T13:06:59Z) - Convergence of adaptive algorithms for weakly convex constrained
optimization [59.36386973876765]
モローエンベロープの勾配のノルムに対して$mathcaltilde O(t-1/4)$収束率を証明する。
我々の分析では、最小バッチサイズが1ドル、定数が1位と2位のモーメントパラメータが1ドル、そしておそらくスムーズな最適化ドメインで機能する。
論文 参考訳(メタデータ) (2020-06-11T17:43:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。