論文の概要: A deep learning method for solving stochastic optimal control problems
driven by fully-coupled FBSDEs
- arxiv url: http://arxiv.org/abs/2204.05796v1
- Date: Tue, 12 Apr 2022 13:31:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-13 17:34:59.885572
- Title: A deep learning method for solving stochastic optimal control problems
driven by fully-coupled FBSDEs
- Title(参考訳): 完全結合fbsdによる確率的最適制御問題の深層学習法
- Authors: Shaolin Ji, Shige Peng, Ying Peng and Xichuan Zhang
- Abstract要約: 本稿では,完全結合前方微分方程式(FBSDEs,略してFBSDEs)によって駆動される高次元最適制御問題の,ディープラーニングによる数値解に着目した。
まず,この問題をStackelberg差分ゲーム(リーダ・フォロワー問題)に変換し,リーダーのコスト関数と追従者のコストがディープニューラルネットワークを介して最適化されるクロス最適化手法(COCO法)を開発する。
数値的な結果については,実用新案による投資消費問題の2つの例を計算し,両例が有効であることを示す。
- 参考スコア(独自算出の注目度): 0.2064612766965483
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we mainly focus on the numerical solution of high-dimensional
stochastic optimal control problem driven by fully-coupled forward-backward
stochastic differential equations (FBSDEs in short) through deep learning. We
first transform the problem into a stochastic Stackelberg differential
game(leader-follower problem), then a cross-optimization method (CO method) is
developed where the leader's cost functional and the follower's cost functional
are optimized alternatively via deep neural networks. As for the numerical
results, we compute two examples of the investment-consumption problem solved
through stochastic recursive utility models, and the results of both examples
demonstrate the effectiveness of our proposed algorithm.
- Abstract(参考訳): 本稿では,完全結合型前方確率微分方程式(FBSDEs,略してFBSDEs)による高次元確率的最適制御問題の数値解に着目した。
まず,この問題を確率的なStackelberg差分ゲーム(リーダー-フォロワー問題)に変換し,より深いニューラルネットワークを用いて,リーダのコスト関数と追従者のコスト関数を最適化するクロス最適化法(CO法)を開発する。
数値計算では,確率的再帰的効用モデルによる投資消費問題の2つの例を計算し,その2つの例が提案アルゴリズムの有効性を示した。
関連論文リスト
- Analyzing and Enhancing the Backward-Pass Convergence of Unrolled
Optimization [50.38518771642365]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
この設定における中心的な課題は最適化問題の解によるバックプロパゲーションであり、しばしば閉形式を欠いている。
本稿では, 非線形最適化の後方通過に関する理論的知見を提供し, 特定の反復法による線形システムの解と等価であることを示す。
Folded Optimizationと呼ばれるシステムが提案され、非ローリングなソルバ実装からより効率的なバックプロパゲーションルールを構築する。
論文 参考訳(メタデータ) (2023-12-28T23:15:18Z) - Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-10-08T23:39:38Z) - Stochastic Unrolled Federated Learning [85.6993263983062]
本稿では,UnRolled Federated Learning (SURF)を導入する。
提案手法は,この拡張における2つの課題,すなわち,非学習者へのデータセット全体の供給の必要性と,フェデレート学習の分散的性質に対処する。
論文 参考訳(メタデータ) (2023-05-24T17:26:22Z) - Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。
本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文 参考訳(メタデータ) (2023-01-28T01:50:42Z) - Deep Graphic FBSDEs for Opinion Dynamics Stochastic Control [27.38625075499457]
本稿では,動的・コスト関数における平均場項結合を用いた意見力学の最適制御問題の解法として,スケーラブルなディープラーニング手法を提案する。
提案したフレームワークは,超大規模問題に対する将来の応用の可能性を開く。
論文 参考訳(メタデータ) (2022-04-05T22:07:32Z) - Momentum Accelerates the Convergence of Stochastic AUPRC Maximization [80.8226518642952]
高精度リコール曲線(AUPRC)に基づく領域の最適化について検討し,不均衡なタスクに広く利用されている。
我々は、$O (1/epsilon4)$のより優れた反復による、$epsilon$定常解を見つけるための新しい運動量法を開発する。
また,O(1/epsilon4)$と同じ複雑さを持つ適応手法の新たなファミリを設計し,実際により高速な収束を享受する。
論文 参考訳(メタデータ) (2021-07-02T16:21:52Z) - Deep Learning for Constrained Utility Maximisation [0.0]
本稿では,ディープラーニングを用いた制御問題を解くための2つのアルゴリズムを提案する。
最初のアルゴリズムはハミルトン・ヤコビ・ベルマン方程式を通じてマルコフ問題を解く。
2つ目は、非マルコフ的問題を解くために双対法の全力を利用する。
論文 参考訳(メタデータ) (2020-08-26T18:40:57Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Solving stochastic optimal control problem via stochastic maximum
principle with deep learning method [0.2064612766965483]
新しい制御問題を解くために3つのアルゴリズムが提案されている。
この手法の重要な応用は、完全非線形PDEの一種に対応するサブ線形期待値を計算することである。
論文 参考訳(メタデータ) (2020-07-05T02:28:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。