論文の概要: Deep Signature Algorithm for Multi-dimensional Path-Dependent Options
- arxiv url: http://arxiv.org/abs/2211.11691v3
- Date: Mon, 15 Jan 2024 14:46:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-18 03:32:54.338012
- Title: Deep Signature Algorithm for Multi-dimensional Path-Dependent Options
- Title(参考訳): 多次元経路依存オプションのためのディープシグナチャアルゴリズム
- Authors: Erhan Bayraktar, Qi Feng, and Zhaoyu Zhang
- Abstract要約: 経路依存型オプションに対するディープシグネチャアルゴリズムについて検討する。
提案アルゴリズムは,ヨーロッパ型とアメリカ型の両方のオプション価格問題に適用する。
アルゴリズムの数値的な例が提供される。
- 参考スコア(独自算出の注目度): 9.798463858410607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we study the deep signature algorithms for path-dependent
options. We extend the backward scheme in [Hur\'e-Pham-Warin. Mathematics of
Computation 89, no. 324 (2020)] for state-dependent FBSDEs with reflections to
path-dependent FBSDEs with reflections, by adding the signature layer to the
backward scheme. Our algorithm applies to both European and American type
option pricing problems while the payoff function depends on the whole paths of
the underlying forward stock process. We prove the convergence analysis of our
numerical algorithm with explicit dependence on the truncation order of the
signature and the neural network approximation errors. Numerical examples for
the algorithm are provided including: Amerasian option under the Black-Scholes
model, American option with a path-dependent geometric mean payoff function,
and the Shiryaev's optimal stopping problem.
- Abstract(参考訳): 本研究では,経路依存オプションに対する深いシグネチャアルゴリズムについて検討する。
我々は[Hur\e-Pham-Warin]の後方スキームを拡張する。
相反スキームにシグネチャ層を加えることにより、経路に依存したfbsdに対するリフレクションを持つ状態依存fbsdに対する計算数学 89, no. 324 (2020)]。
当社のアルゴリズムはヨーロッパとアメリカの両タイプのオプション価格問題に適用される一方、支払い関数は基礎となるフォワードストックプロセスの全パスに依存します。
本稿では, 数値アルゴリズムの収束解析を, シグネチャのトランケーション順序とニューラルネットワーク近似誤差に明示的に依存して証明する。
このアルゴリズムの数値的な例は、ブラックスコールズモデルの下でのアメラシアンオプション、経路依存的な幾何学的平均ペイオフ関数を持つアメリカンオプション、シリャエフの最適停止問題である。
関連論文リスト
- A Sample Efficient Alternating Minimization-based Algorithm For Robust Phase Retrieval [56.67706781191521]
そこで本研究では,未知の信号の復元を課題とする,ロバストな位相探索問題を提案する。
提案するオラクルは、単純な勾配ステップと外れ値を用いて、計算学的スペクトル降下を回避している。
論文 参考訳(メタデータ) (2024-09-07T06:37:23Z) - A Mirror Descent-Based Algorithm for Corruption-Tolerant Distributed Gradient Descent [57.64826450787237]
本研究では, 分散勾配降下アルゴリズムの挙動を, 敵対的腐敗の有無で解析する方法を示す。
汚職耐性の分散最適化アルゴリズムを設計するために、(怠慢な)ミラー降下からアイデアをどう使うかを示す。
MNISTデータセットの線形回帰、サポートベクトル分類、ソフトマックス分類に基づく実験は、我々の理論的知見を裏付けるものである。
論文 参考訳(メタデータ) (2024-07-19T08:29:12Z) - Regret Analysis of Policy Gradient Algorithm for Infinite Horizon
Average Reward Markov Decision Processes [38.879933964474326]
我々は、無限水平平均報酬マルコフ決定過程(MDP)を考える。
政策勾配に基づくアルゴリズムを提案し,その大域収束特性を示す。
提案アルゴリズムが $tildemathcalO(T3/4)$ regret であることを示す。
論文 参考訳(メタデータ) (2023-09-05T03:22:46Z) - Refined Regret for Adversarial MDPs with Linear Function Approximation [50.00022394876222]
我々は,損失関数が約1,300ドル以上のエピソードに対して任意に変化するような,敵対的決定過程(MDP)の学習を検討する。
本稿では,同じ設定で$tildemathcal O(K2/3)$に対する後悔を改善する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-30T14:37:21Z) - Projection-free Adaptive Regret with Membership Oracles [31.422532403048738]
ほとんどの反復アルゴリズムは凸集合への射影の計算を必要とし、計算コストがかかる。
GK22による最近の研究は、フランク・ウルフのアプローチに基づく射影自由アルゴリズムによる準線形適応的後悔の保証を与えた。
我々はMhammedi22にインスパイアされた異なる手法に基づくプロジェクションフリーなアルゴリズムを提案し、プロジェクションをセットメンバーシップ計算で置き換える。
論文 参考訳(メタデータ) (2022-11-22T23:53:06Z) - A gradient estimator via L1-randomization for online zero-order
optimization with two point feedback [93.57603470949266]
2つの関数評価とランダム化に基づく新しい勾配推定器を提案する。
ゼロ次オラクルの雑音に対する仮定は,ノイズのキャンセルと逆方向雑音の2種類について考察する。
我々は、問題の全てのパラメータに適応する、いつでも完全にデータ駆動のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-05-27T11:23:57Z) - Deep Signature FBSDE Algorithm [11.634777651835076]
状態と経路に依存する特徴を持つ前方微分方程式 (FBSDE) を解くために, ディープシグネチャ/log-signature FBSDEアルゴリズムを提案する。
ニューラルネット(RNN)モデルにディープシグネチャ/ログ-シグネチャ変換を組み込むことで,トレーニング時間を短縮し,精度を向上し,既存の文献の手法と比較して時間的地平線を延長する。
論文 参考訳(メタデータ) (2021-08-24T03:21:26Z) - Finite-Sample Analysis of Off-Policy Natural Actor-Critic Algorithm [4.932130498861987]
重要度サンプリングに基づく自然アクタ-クリティック(nac)アルゴリズムのオフポリシー変種に対する有限サンプル収束保証を提供する。
このアルゴリズムは、ステップの適切な選択の下で$mathcalo(epsilon-3log2(1/epsilon)$のサンプル複雑性を持つ大域的最適ポリシーに収束する。
論文 参考訳(メタデータ) (2021-02-18T13:22:59Z) - Learning Infinite-horizon Average-reward MDPs with Linear Function
Approximation [44.374427255708135]
線形関数近似を用いた無限水平平均逆設定でマルコフ決定過程を学習するための新しいアルゴリズムを開発した。
まず,最適$widetildeO(sqrtT)$ regretの計算非効率アルゴリズムを提案する。
次に,逆線形包帯から着想を得て,$widetildeO(sqrtT)$ regretのアルゴリズムを新たに開発した。
論文 参考訳(メタデータ) (2020-07-23T08:23:44Z) - Private Stochastic Non-Convex Optimization: Adaptive Algorithms and
Tighter Generalization Bounds [72.63031036770425]
有界非次元最適化のための差分プライベート(DP)アルゴリズムを提案する。
標準勾配法に対する経験的優位性について,2つの一般的なディープラーニング手法を実証する。
論文 参考訳(メタデータ) (2020-06-24T06:01:24Z) - Optimistic Policy Optimization with Bandit Feedback [70.75568142146493]
我々は,事前の報奨を後悔する$tilde O(sqrtS2 A H4 K)を定め,楽観的な信頼領域ポリシー最適化(TRPO)アルゴリズムを提案する。
我々の知る限り、この2つの結果は、未知の遷移と帯域幅フィードバックを持つポリシー最適化アルゴリズムにおいて得られた最初のサブ線形後悔境界である。
論文 参考訳(メタデータ) (2020-02-19T15:41:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。