論文の概要: Fractional-Boundary-Regularized Deep Galerkin Method for Variational Inequalities in Mixed Optimal Stopping and Control
- arxiv url: http://arxiv.org/abs/2505.19309v1
- Date: Sun, 25 May 2025 20:49:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.044772
- Title: Fractional-Boundary-Regularized Deep Galerkin Method for Variational Inequalities in Mixed Optimal Stopping and Control
- Title(参考訳): 混合最適停止・制御における変分不等式に対する分数境界規則化ディープ・ガレルキン法
- Authors: Yun Zhao, Harry Zheng,
- Abstract要約: 混合最適停止問題と制御問題により、非線型ハミルトン・ヤコビ・ベルマン作用素の変分不等式が定義される。
まず、双対アプローチを用いて線形作用素に変換し、次にフラクショナル境界規則化Deep Galerkin法を導入する。
改良された精度により、ネットワークはデュアルトランスフォーメーションを使用して元のソリューションに変換される。
- 参考スコア(独自算出の注目度): 3.514024064150887
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mixed optimal stopping and stochastic control problems define variational inequalities with non-linear Hamilton-Jacobi-Bellman (HJB) operators, whose numerical solution is notoriously difficult and lack of reliable benchmarks. We first use the dual approach to transform it into a linear operator, and then introduce a Fractional-Boundary-Regularized Deep Galerkin Method (FBR-DGM) that augments the classical $L^2$ loss with Sobolev-Slobodeckij norms on the parabolic boundary, enforcing regularity and yielding consistent improvements in the network approximation and its derivatives. The improved accuracy allows the network to be converted back to the original solution using the dual transform. The self-consistency and stability of the network can be tested by checking the primal-dual relationship among optimal value, optimal wealth, and optimal control, offering innovative benchmarks in the absence of analytical solutions.
- Abstract(参考訳): 混合最適停止と確率制御の問題は、非線型ハミルトン・ヤコビ・ベルマン作用素(HJB)の変分不等式を定義する。
まず、双対アプローチを用いて線形作用素に変換し、次に、古典的な$L^2$損失をパラボリック境界上のSobolev-Slobodeckijノルムで増大させ、正規性を強制し、ネットワーク近似とその導関数に一貫した改善をもたらすFBR-DGM(Fractional-Boundary-Regularized Deep Galerkin Method)を導入する。
改良された精度により、ネットワークはデュアルトランスフォーメーションを使用して元のソリューションに変換される。
ネットワークの自己整合性と安定性は、最適値、最適富、最適制御の間の原始二重関係をチェックし、分析解がない場合に革新的なベンチマークを提供することによって検証することができる。
関連論文リスト
- A Fresh Look at Generalized Category Discovery through Non-negative Matrix Factorization [83.12938977698988]
Generalized Category Discovery (GCD) は、ラベル付きベースデータを用いて、ベース画像と新規画像の両方を分類することを目的としている。
現在のアプローチでは、コサイン類似性に基づく共起行列 $barA$ の固有の最適化に不適切に対処している。
本稿では,これらの欠陥に対処するNon-Negative Generalized Category Discovery (NN-GCD) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T07:24:11Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - The Strength of Nesterov's Extrapolation in the Individual Convergence
of Nonsmooth Optimization [0.0]
ネステロフの外挿は、非滑らかな問題に対して勾配降下法の個人収束を最適にする強さを持つことを証明している。
提案手法は,設定の非滑らかな損失を伴って正規化学習タスクを解くためのアルゴリズムの拡張である。
本手法は,大規模な1-正規化ヒンジロス学習問題の解法として有効である。
論文 参考訳(メタデータ) (2020-06-08T03:35:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。