論文の概要: Deep Learning for the Multiple Optimal Stopping Problem
- arxiv url: http://arxiv.org/abs/2512.22961v1
- Date: Sun, 28 Dec 2025 15:09:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.301058
- Title: Deep Learning for the Multiple Optimal Stopping Problem
- Title(参考訳): 多重最適停止問題に対する深層学習
- Authors: Mathieu Laurière, Mehdi Talbi,
- Abstract要約: 本稿では,高次元における複数の最適停止問題を解くための新しいディープラーニングフレームワークを提案する。
我々は、動的プログラミング原理とニューラルネットワークによる値関数の近似を組み合わせることで、この問題に対処する。
- 参考スコア(独自算出の注目度): 2.394379536305005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel deep learning framework for solving multiple optimal stopping problems in high dimensions. While deep learning has recently shown promise for single stopping problems, the multiple exercise case involves complex recursive dependencies that remain challenging. We address this by combining the Dynamic Programming Principle with neural network approximation of the value function. Unlike policy-search methods, our algorithm explicitly learns the value surface. We first consider the discrete-time problem and analyze neural network training error. We then turn to continuous problems and analyze the additional error due to the discretization of the underlying stochastic processes. Numerical experiments on high-dimensional American basket options and nonlinear utility maximization demonstrate that our method provides an efficient and scalable method for the multiple optimal stopping problem.
- Abstract(参考訳): 本稿では,高次元における複数の最適停止問題を解くための新しいディープラーニングフレームワークを提案する。
ディープラーニングは最近、単一停止問題への期待を示しているが、複数のエクササイズケースでは複雑な再帰的な依存関係が伴うため、依然として困難である。
我々は、動的プログラミング原理とニューラルネットワークによる値関数の近似を組み合わせることで、この問題に対処する。
ポリシー探索法とは異なり,提案アルゴリズムは値面を明示的に学習する。
まず、離散時間問題を考察し、ニューラルネットワークのトレーニングエラーを分析する。
次に、連続問題に目を向け、基礎となる確率過程の離散化による追加誤差を解析する。
高次元アメリカのバスケットオプションと非線形効用最大化に関する数値実験により、本手法が複数の最適停止問題に対して効率的かつスケーラブルな方法を提供することを示した。
関連論文リスト
- Single-loop Algorithms for Stochastic Non-convex Optimization with Weakly-Convex Constraints [49.76332265680669]
本稿では、目的関数と制約関数の両方が弱凸である問題の重要な部分集合について検討する。
既存の手法では、収束速度の遅さや二重ループ設計への依存など、しばしば制限に直面している。
これらの課題を克服するために,新しい単一ループペナルティに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-21T17:15:48Z) - Self-Supervised Penalty-Based Learning for Robust Constrained Optimization [4.297070083645049]
本稿では,自己教師付きペナルティに基づく損失関数を用いた学習に基づいて,パラメータ化制約付きロバスト最適化のための新しい手法を提案する。
我々のアプローチは、従来の解法よりも推論時間がかなり小さいニューラルネットワーク近似を効果的に学習することができる。
論文 参考訳(メタデータ) (2025-03-07T06:42:17Z) - Deep multitask neural networks for solving some stochastic optimal
control problems [0.0]
本稿では,最適制御問題のクラスについて考察し,ニューラルネットワークを用いた効果的な解法を提案する。
マルチタスクニューラルネットワークをトレーニングするために,タスク間の学習を動的にバランスさせる新しいスキームを導入する。
実世界のデリバティブ価格問題に関する数値実験を通じて,本手法が最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-01-23T17:20:48Z) - Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-10-08T23:39:38Z) - Primal Dual Continual Learning: Balancing Stability and Plasticity through Adaptive Memory Allocation [86.8475564814154]
制約付き最適化問題を直接実行することは可能かつ有益であることを示す。
メモリベースのメソッドでは、以前のタスクからのサンプルの小さなサブセットをリプレイバッファに格納できる。
両変数は,制約摂動に対する連続学習問題の最適値の感度を示す。
論文 参考訳(メタデータ) (2023-09-29T21:23:27Z) - Continual Learning Beyond a Single Model [28.130513524601145]
そこで本研究では,アンサンブルモデルを用いることで,連続的な性能向上を図った。
本稿では,単一モデルに類似した実行時間を持つ計算コストの低いアルゴリズムを提案し,アンサンブルの性能上の利点を享受する。
論文 参考訳(メタデータ) (2022-02-20T14:30:39Z) - Physarum Powered Differentiable Linear Programming Layers and
Applications [48.77235931652611]
一般線形プログラミング問題に対する効率的かつ微分可能な解法を提案する。
本稿では,ビデオセグメンテーションタスクとメタラーニングにおける問題解決手法について述べる。
論文 参考訳(メタデータ) (2020-04-30T01:50:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。