論文の概要: Deep combinatorial optimisation for optimal stopping time problems :
application to swing options pricing
- arxiv url: http://arxiv.org/abs/2001.11247v2
- Date: Fri, 8 Jan 2021 14:55:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 12:29:06.840432
- Title: Deep combinatorial optimisation for optimal stopping time problems :
application to swing options pricing
- Title(参考訳): 最適停止時間問題に対するディープコンビネート最適化 : swingオプション価格設定への応用
- Authors: Thomas Deschatre and Joseph Mikael
- Abstract要約: ニューラルネットワークと離散確率変数のランダム化を用いた新しい計算制御法を提案し, 最適停止時間問題に適用した。
提案アルゴリズムは、古典的アルゴリズムでは不可能なような、高次元のアメリカンとスイングのオプションを妥当な時間で価格設定することに成功している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A new method for stochastic control based on neural networks and using
randomisation of discrete random variables is proposed and applied to optimal
stopping time problems. The method models directly the policy and does not need
the derivation of a dynamic programming principle nor a backward stochastic
differential equation. Unlike continuous optimization where automatic
differentiation is used directly, we propose a likelihood ratio method for
gradient computation. Numerical tests are done on the pricing of American and
swing options. The proposed algorithm succeeds in pricing high dimensional
American and swing options in a reasonable computation time, which is not
possible with classical algorithms.
- Abstract(参考訳): ニューラルネットワークに基づく確率制御と離散確率変数のランダム化を用いた新しい手法を提案し,最適停止時間問題に適用した。
この方法は方針を直接モデル化し、動的プログラミング原理や後方確率微分方程式の導出を必要としない。
自動微分が直接使用される連続最適化とは異なり, 勾配計算の確率比法を提案する。
数値テストは、アメリカンオプションとスイングオプションの価格で行われます。
提案アルゴリズムは,従来のアルゴリズムでは不可能な,高精度な計算時間で高次元のアメリカンとスウィングオプションの価格設定に成功している。
関連論文リスト
- Regret-Optimal Model-Free Reinforcement Learning for Discounted MDPs
with Short Burn-In Time [13.545356254920584]
本稿では,分散削減を利用したモデルフリーアルゴリズムと,実行方針を低速かつ適応的に切り替える新しい手法を提案する。
これは割引設定における最初の後悔の最適モデルフリーアルゴリズムであり、バーンイン時間の短縮によるメリットがある。
論文 参考訳(メタデータ) (2023-05-24T20:22:43Z) - Accelerated First-Order Optimization under Nonlinear Constraints [73.2273449996098]
我々は、制約付き最適化のための一階アルゴリズムと非滑らかなシステムの間で、新しい一階アルゴリズムのクラスを設計する。
これらのアルゴリズムの重要な性質は、制約がスパース変数の代わりに速度で表されることである。
論文 参考訳(メタデータ) (2023-02-01T08:50:48Z) - Maximum-Likelihood Inverse Reinforcement Learning with Finite-Time
Guarantees [56.848265937921354]
逆強化学習(IRL)は報酬関数と関連する最適ポリシーを回復することを目的としている。
IRLの多くのアルゴリズムは本質的にネスト構造を持つ。
我々は、報酬推定精度を損なわないIRLのための新しいシングルループアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-10-04T17:13:45Z) - Latency considerations for stochastic optimizers in variational quantum
algorithms [0.02294014185517203]
ノイズの多い中間雑音の量子スケール設定で顕著になった変分量子アルゴリズムは、ハードウェアの実装を必要とする。
これまでのところ、ほとんどの研究では勾配反復を古典的な反復として用いたアルゴリズムが採用されている。
本研究では,古典的決定論的アルゴリズムの力学をエミュレートするプロセスを生成する最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-01-31T18:51:24Z) - Momentum Accelerates the Convergence of Stochastic AUPRC Maximization [80.8226518642952]
高精度リコール曲線(AUPRC)に基づく領域の最適化について検討し,不均衡なタスクに広く利用されている。
我々は、$O (1/epsilon4)$のより優れた反復による、$epsilon$定常解を見つけるための新しい運動量法を開発する。
また,O(1/epsilon4)$と同じ複雑さを持つ適応手法の新たなファミリを設計し,実際により高速な収束を享受する。
論文 参考訳(メタデータ) (2021-07-02T16:21:52Z) - An Adaptive Stochastic Sequential Quadratic Programming with
Differentiable Exact Augmented Lagrangians [17.9230793188835]
本稿では,客観的・決定論的等式を考慮した非線形最適化プログラムの解法について考察する。
本稿では,微分可能な拡張ラグランジアンをメリット関数として用いた逐次二次計画法(SQP)を提案する。
提案アルゴリズムは,行探索手順と1行探索手順を許容する最初のSQPである。
論文 参考訳(メタデータ) (2021-02-10T08:40:55Z) - Divide and Learn: A Divide and Conquer Approach for Predict+Optimize [50.03608569227359]
予測+最適化問題は、予測係数を使用する最適化プロブレムと、確率係数の機械学習を組み合わせる。
本稿では, 予測係数を1次線形関数として, 最適化問題の損失を直接表現する方法を示す。
本稿では,この制約を伴わずに最適化問題に対処し,最適化損失を用いてその係数を予測する新しい分割アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-04T00:26:56Z) - Variance-Reduced Off-Policy Memory-Efficient Policy Search [61.23789485979057]
政治政策の最適化は強化学習において難しい問題である。
オフポリシーアルゴリズムはメモリ効率が高く、オフポリシーサンプルから学ぶことができる。
論文 参考訳(メタデータ) (2020-09-14T16:22:46Z) - Stochastic Adaptive Line Search for Differentially Private Optimization [6.281099620056346]
プライベート勾配に基づく最適化アルゴリズムの性能は、選択ステップサイズ(または学習率)に大きく依存する。
ノイズ勾配の信頼性に応じて、プライバシー勾配を調整する古典的非自明な行探索アルゴリズムを提案する。
適応的に選択されたステップサイズにより、提案アルゴリズムは、プライバシ予算を効率的に利用し、既存のプライベートグラデーションと競合する性能を示すことができる。
論文 参考訳(メタデータ) (2020-08-18T15:18:47Z) - Sequential Quadratic Optimization for Nonlinear Equality Constrained
Stochastic Optimization [10.017195276758454]
この設定では、客観的関数と微分値を明示的に計算することは難しそうだと仮定する。
最先端のライン探索SQPアルゴリズムをモデルとした決定論的設定のためのアルゴリズムを提案する。
数値実験の結果は,提案手法の実用性を示すものである。
論文 参考訳(メタデータ) (2020-07-20T23:04:26Z) - Private Stochastic Convex Optimization: Optimal Rates in Linear Time [74.47681868973598]
本研究では,凸損失関数の分布から得られた個体群損失を最小化する問題について検討する。
Bassilyらによる最近の研究は、$n$のサンプルを与えられた過剰な人口損失の最適境界を確立している。
本稿では,余剰損失に対する最適境界を達成するとともに,$O(minn, n2/d)$グラデーション計算を用いて凸最適化アルゴリズムを導出する2つの新しい手法について述べる。
論文 参考訳(メタデータ) (2020-05-10T19:52:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。