論文の概要: Deep Learning and Elicitability for McKean-Vlasov FBSDEs With Common Noise
- arxiv url: http://arxiv.org/abs/2512.14967v1
- Date: Tue, 16 Dec 2025 23:39:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.806828
- Title: Deep Learning and Elicitability for McKean-Vlasov FBSDEs With Common Noise
- Title(参考訳): 共通雑音を有するMcKean-Vlasov FBSDEの深層学習と緩和性
- Authors: Felipe J. P. Antunes, Yuri F. Saporito, Sebastian Jaimungal,
- Abstract要約: 本稿では,McKean-Vlasov前方微分方程式(MV-FBSDEs)を一般雑音で解くための新しい数値解法を提案する。
重要なイノベーションは、パスワイズ損失関数の導出を可能にすることであり、ニューラルネットワークの効率的なトレーニングにより、一般的なノイズから生じる後方プロセスと条件予測の両方を近似することができる。
解析解が存在する銀行間貸借モデルを用いて,本アルゴリズムの有効性を検証し,真の解の正確な回復を実証する。
- 参考スコア(独自算出の注目度): 2.421459418045937
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present a novel numerical method for solving McKean-Vlasov forward-backward stochastic differential equations (MV-FBSDEs) with common noise, combining Picard iterations, elicitability and deep learning. The key innovation involves elicitability to derive a path-wise loss function, enabling efficient training of neural networks to approximate both the backward process and the conditional expectations arising from common noise - without requiring computationally expensive nested Monte Carlo simulations. The mean-field interaction term is parameterized via a recurrent neural network trained to minimize an elicitable score, while the backward process is approximated through a feedforward network representing the decoupling field. We validate the algorithm on a systemic risk inter-bank borrowing and lending model, where analytical solutions exist, demonstrating accurate recovery of the true solution. We further extend the model to quantile-mediated interactions, showcasing the flexibility of the elicitability framework beyond conditional means or moments. Finally, we apply the method to a non-stationary Aiyagari--Bewley--Huggett economic growth model with endogenous interest rates, illustrating its applicability to complex mean-field games without closed-form solutions.
- Abstract(参考訳): 我々は,McKean-Vlasov前向き確率微分方程式(MV-FBSDEs)を共通の雑音で解くための新しい数値計算法を提案する。
重要なイノベーションは、パスワイズ損失関数の導出を可能にすることであり、計算コストのかかるモンテカルロシミュレーションを必要とせずに、ニューラルネットワークの効率的なトレーニングにより、一般的なノイズから生じる後方プロセスと条件予測の両方を近似することができる。
平均場相互作用項は、除去可能なスコアを最小限に抑えるために訓練されたリカレントニューラルネットワークを介してパラメータ化され、後方処理は、デカップリングフィールドを表すフィードフォワードネットワークを介して近似される。
解析解が存在する銀行間貸借モデルを用いて,本アルゴリズムの有効性を検証し,真の解の正確な回復を実証する。
我々はさらに、モデルを拡張して、条件付き手段やモーメントを超えて、Elicitabilityフレームワークの柔軟性を示す。
最後に,本手法を内因性金利を持つ非定常的Aiyagari--Bewley--Huggett経済成長モデルに適用し,閉形式解のない複雑な平均場ゲームに適用可能であることを示す。
関連論文リスト
- Certified Neural Approximations of Nonlinear Dynamics [51.01318247729693]
安全クリティカルな文脈では、神経近似の使用は、基礎となるシステムとの密接性に公式な境界を必要とする。
本稿では,認証された一階述語モデルに基づく新しい,適応的で並列化可能な検証手法を提案する。
論文 参考訳(メタデータ) (2025-05-21T13:22:20Z) - An Empirical Risk Minimization Approach for Offline Inverse RL and Dynamic Discrete Choice Model [8.95720650633184]
機械学習において、動的選択(DDC)モデル(オフライン最大エントロピー正規化逆強化学習(オフラインMaxEnt-IRL))を推定する問題について検討する。
目的は、オフラインの振舞いデータからエージェントの振舞いを管理する$Q*$関数をリカバリすることである。
線形パラメータ化報酬の制限的仮定を使わずにこれらの問題を解くための大域収束勾配法を提案する。
論文 参考訳(メタデータ) (2025-02-19T22:22:20Z) - MIBP-Cert: Certified Training against Data Perturbations with Mixed-Integer Bilinear Programs [50.41998220099097]
トレーニング中のデータエラー、汚職、中毒攻撃は、現代のAIシステムの信頼性に大きな脅威をもたらす。
混合整数双線形プログラミング(MIBP)に基づく新しい認証手法MIBP-Certを紹介する。
摂動データや操作データを通じて到達可能なパラメータの集合を計算することで、可能なすべての結果を予測することができ、堅牢性を保証することができる。
論文 参考訳(メタデータ) (2024-12-13T14:56:39Z) - Distributionally Robust Model-based Reinforcement Learning with Large
State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。
広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。
本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:42:11Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Neural Control Variates [71.42768823631918]
ニューラルネットワークの集合が、積分のよい近似を見つけるという課題に直面していることを示す。
理論的に最適な分散最小化損失関数を導出し、実際に安定したオンライントレーニングを行うための代替の複合損失を提案する。
具体的には、学習した光場近似が高次バウンスに十分な品質であることを示し、誤差補正を省略し、無視可能な可視バイアスのコストでノイズを劇的に低減できることを示した。
論文 参考訳(メタデータ) (2020-06-02T11:17:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。