論文の概要: Learning High-Dimensional McKean-Vlasov Forward-Backward Stochastic
Differential Equations with General Distribution Dependence
- arxiv url: http://arxiv.org/abs/2204.11924v3
- Date: Mon, 18 Sep 2023 18:25:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 20:53:16.260921
- Title: Learning High-Dimensional McKean-Vlasov Forward-Backward Stochastic
Differential Equations with General Distribution Dependence
- Title(参考訳): 一般分布依存を伴う高次元マッケイン・ブラソフ前方確率微分方程式の学習
- Authors: Jiequn Han, Ruimeng Hu, Jihao Long
- Abstract要約: 本稿では,MV-FBSDEを平均場相互作用の一般形式で計算するための新しいディープラーニング手法を提案する。
我々は、高次元MV-FBSDEを解くために、ディープニューラルネットワークを用いて標準BSDEと近似係数関数を解く。
- 参考スコア(独自算出の注目度): 6.253771639590562
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One of the core problems in mean-field control and mean-field games is to
solve the corresponding McKean-Vlasov forward-backward stochastic differential
equations (MV-FBSDEs). Most existing methods are tailored to special cases in
which the mean-field interaction only depends on expectation or other moments
and thus inadequate to solve problems when the mean-field interaction has full
distribution dependence.
In this paper, we propose a novel deep learning method for computing
MV-FBSDEs with a general form of mean-field interactions. Specifically, built
on fictitious play, we recast the problem into repeatedly solving standard
FBSDEs with explicit coefficient functions. These coefficient functions are
used to approximate the MV-FBSDEs' model coefficients with full distribution
dependence, and are updated by solving another supervising learning problem
using training data simulated from the last iteration's FBSDE solutions. We use
deep neural networks to solve standard BSDEs and approximate coefficient
functions in order to solve high-dimensional MV-FBSDEs. Under proper
assumptions on the learned functions, we prove that the convergence of the
proposed method is free of the curse of dimensionality (CoD) by using a class
of integral probability metrics previously developed in [Han, Hu and Long,
arXiv:2104.12036]. The proved theorem shows the advantage of the method in high
dimensions. We present the numerical performance in high-dimensional MV-FBSDE
problems, including a mean-field game example of the well-known Cucker-Smale
model whose cost depends on the full distribution of the forward process.
- Abstract(参考訳): 平均場制御と平均場ゲームにおける主要な問題の1つは、対応するmckean-vlasov forward-backward stochastic differential equation (mv-fbsdes) を解くことである。
既存の手法の多くは、平均場相互作用が期待や他のモーメントにのみ依存する特別な場合に合わせたものであるため、平均場相互作用が完全な分布依存性を持つ場合の問題を解決するには不十分である。
本稿では,MV-FBSDEを平均場相互作用の一般形式で計算するための新しいディープラーニング手法を提案する。
具体的には、架空の遊びに基づいて、問題を明示的な係数関数を持つ標準 fbsd の繰り返し解に再キャストする。
これらの係数関数は、MV-FBSDEsモデル係数を全分布依存性に近似するために使用され、前回の反復のFBSDEソリューションからシミュレーションしたトレーニングデータを用いて、別の監視学習問題を解くことで更新される。
我々は,高次元mv-fbsdesを解くために,ディープニューラルネットワークを用いて標準bsdと近似係数関数を解く。
学習関数の適切な仮定の下で、提案手法の収束は、[Han, Hu and Long, arXiv:2104.12036] で以前に開発された積分確率指標のクラスを用いて、次元性の呪い(CoD)のないことを証明した。
証明された定理は、高次元での方法の利点を示している。
本稿では,前処理の完全分布に依存するCucker-Smaleモデルの平均フィールドゲーム例を含む,高次元MV-FBSDE問題における数値性能について述べる。
関連論文リスト
- Stochastic Q-learning for Large Discrete Action Spaces [79.1700188160944]
離散的な行動空間を持つ複雑な環境では、強化学習(RL)において効果的な意思決定が重要である
我々は、$n$アクションの集合全体を最適化するのとは対照的に、おそらく$mathcalO(log(n)$)$のような変数の集合のみを考える。
提示された値ベースのRL手法には、Q-learning、StochDQN、StochDDQNなどが含まれる。
論文 参考訳(メタデータ) (2024-05-16T17:58:44Z) - Learning-based Multi-continuum Model for Multiscale Flow Problems [24.93423649301792]
本稿では,同質化方程式の強化と,マルチスケール問題に対する単一モデルの精度向上を目的とした学習型マルチコンチニュウムモデルを提案する。
提案する学習型マルチコンチニュウムモデルでは,各粗いグリッドブロック内の複数の相互作用媒質を解決し,その間の物質移動を記述できる。
論文 参考訳(メタデータ) (2024-03-21T02:30:56Z) - Deep Reinforcement Learning for Adaptive Mesh Refinement [0.9281671380673306]
我々は数値シミュレーションから直接AMR戦略のポリシーネットワークを訓練する。
トレーニング過程は、偏微分方程式に対する厳密な解や高忠実な基底真理を必要としない。
深層強化学習政策は、一般的なAMRと競合し、問題クラス全体にわたってうまく一般化し、精度とコストのバランスが良好であることを示す。
論文 参考訳(メタデータ) (2022-09-25T23:45:34Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Message Passing Neural PDE Solvers [60.77761603258397]
我々は、バックプロップ最適化されたニューラル関数近似器で、グラフのアリーデザインのコンポーネントを置き換えるニューラルメッセージパッシング解決器を構築した。
本稿では, 有限差分, 有限体積, WENOスキームなどの古典的手法を表現的に含んでいることを示す。
本研究では, 異なる領域のトポロジ, 方程式パラメータ, 離散化などにおける高速, 安定, 高精度な性能を, 1次元, 2次元で検証する。
論文 参考訳(メタデータ) (2022-02-07T17:47:46Z) - Distributed Methods with Compressed Communication for Solving
Variational Inequalities, with Theoretical Guarantees [115.08148491584997]
本稿では,MASHA1 と MASHA2 の圧縮通信による変分不等式とサドル点問題の解法について理論的に検討した。
新しいアルゴリズムは双方向圧縮をサポートし、バッチの設定や、クライアントの部分的な参加を伴うフェデレーション学習のために修正することもできる。
論文 参考訳(メタデータ) (2021-10-07T10:04:32Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - A Bayesian Multiscale Deep Learning Framework for Flows in Random Media [0.0]
マルチスケール偏微分方程式(PDE)によって制御される複雑なシステムの微細スケールシミュレーションは計算コストが高く,そのような問題に対処する様々なマルチスケール手法が開発されている。
本研究では,学習データに制限のあるマルチスケールPDEのためのハイブリッドディープラーニングとマルチスケールアプローチを提案する。
実演目的では,多孔質メディアフローの問題に焦点をあてる。
画像から画像への教師あり深層学習モデルを用いて,入力透過性場とマルチスケール基底関数のマッピングを学習する。
論文 参考訳(メタデータ) (2021-03-08T23:11:46Z) - Efficient semidefinite-programming-based inference for binary and
multi-class MRFs [83.09715052229782]
分割関数やMAP推定をペアワイズMRFで効率的に計算する手法を提案する。
一般のバイナリMRFから完全多クラス設定への半定緩和を拡張し、解法を用いて再び効率的に解けるようなコンパクトな半定緩和を開発する。
論文 参考訳(メタデータ) (2020-12-04T15:36:29Z) - Multi-Fidelity High-Order Gaussian Processes for Physical Simulation [24.033468062984458]
高忠実度偏微分方程式(PDE)は低忠実度偏微分方程式よりも高価である。
複雑な相関関係を捉えることができるMFHoGP(Multi-Fidelity High-Order Gaussian Process)を提案する。
MFHoGPは、情報を融合するために基礎を伝播し、基礎重みよりも先に深い行列GPを配置する。
論文 参考訳(メタデータ) (2020-06-08T22:31:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。