論文の概要: Alternating the Population and Control Neural Networks to Solve
High-Dimensional Stochastic Mean-Field Games
- arxiv url: http://arxiv.org/abs/2002.10113v3
- Date: Thu, 18 Feb 2021 23:36:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 03:29:49.507180
- Title: Alternating the Population and Control Neural Networks to Solve
High-Dimensional Stochastic Mean-Field Games
- Title(参考訳): 高次元確率平均場ゲームのための人口交替と制御ニューラルネットワーク
- Authors: Alex Tong Lin, Samy Wu Fung, Wuchen Li, Levon Nurbekyan, Stanley J.
Osher
- Abstract要約: 我々は平均フィールドゲーム(MFG)を解くための交互人口とエージェント制御ニューラルネットワークを提案する。
提案アルゴリズムは,既存の解法に到達できないMFGの高次元例を対象としている。
最大100次元MFG問題に対する本手法の可能性を示す。
- 参考スコア(独自算出の注目度): 9.909883019034613
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present APAC-Net, an alternating population and agent control neural
network for solving stochastic mean field games (MFGs). Our algorithm is geared
toward high-dimensional instances of MFGs that are beyond reach with existing
solution methods. We achieve this in two steps. First, we take advantage of the
underlying variational primal-dual structure that MFGs exhibit and phrase it as
a convex-concave saddle point problem. Second, we parameterize the value and
density functions by two neural networks, respectively. By phrasing the problem
in this manner, solving the MFG can be interpreted as a special case of
training a generative adversarial network (GAN). We show the potential of our
method on up to 100-dimensional MFG problems.
- Abstract(参考訳): 本稿では,確率的平均場ゲーム(MFG)を解くための交互人口とエージェント制御ニューラルネットワークであるAPAC-Netを提案する。
提案アルゴリズムは,既存の解法に到達できないMFGの高次元例を対象としている。
これを2つのステップで達成します。
第一に,MFGsが発現する基本・双対構造の変動を利用して,凸凹型サドル点問題と表現する。
次に、2つのニューラルネットワークでそれぞれ値と密度関数をパラメータ化する。
この方法で問題を表現することにより、MFGを解くことは、生成的敵ネットワーク(GAN)を訓練する特別なケースと解釈できる。
最大100次元MFG問題に対する本手法の可能性を示す。
関連論文リスト
- Scalable spectral representations for network multiagent control [53.631272539560435]
マルチエージェント制御の一般的なモデルであるNetwork Markov Decision Processes (MDPs)は、効率的な学習に重大な課題をもたらす。
まず、ネットワークMDPに対してスケーラブルなスペクトル局所表現を導出し、各エージェントの局所$Q$関数に対するネットワーク線形部分空間を誘導する。
我々は,連続的な状態対応ネットワークMDPのためのスケーラブルなアルゴリズムフレームワークを設計し,アルゴリズムの収束をエンドツーエンドで保証する。
論文 参考訳(メタデータ) (2024-10-22T17:45:45Z) - Optimization Guarantees of Unfolded ISTA and ADMM Networks With Smooth
Soft-Thresholding [57.71603937699949]
我々は,学習エポックの数の増加とともに,ほぼゼロに近いトレーニング損失を達成するための最適化保証について検討した。
トレーニングサンプル数に対する閾値は,ネットワーク幅の増加とともに増加することを示す。
論文 参考訳(メタデータ) (2023-09-12T13:03:47Z) - Deep Learning for Mean Field Games with non-separable Hamiltonians [0.0]
本稿では,高次元平均場ゲーム(MFG)の解法を提案する。
2つのニューラルネットワークを用いて、MFGシステムの未知の解とフォワードバック条件を近似する。
提案手法は,少数のイテレーションでも効率的であり,最大300次元の処理を単一層で行うことができる。
論文 参考訳(メタデータ) (2023-01-07T15:39:48Z) - Bridging Mean-Field Games and Normalizing Flows with Trajectory
Regularization [11.517089115158225]
平均場ゲーム(MFG)は、多数の相互作用エージェントを持つシステムのモデリングフレームワークである。
正規化フロー(NFs)は、可逆写像を用いてデータ可能性を計算する深層生成モデルのファミリーである。
本研究では,NF の学習を MFG の解法としてコンテキスト化することにより,MFG と NF の関係を明らかにする。
論文 参考訳(メタデータ) (2022-06-30T02:44:39Z) - On the Effective Number of Linear Regions in Shallow Univariate ReLU
Networks: Convergence Guarantees and Implicit Bias [50.84569563188485]
我々は、ラベルが$r$のニューロンを持つターゲットネットワークの符号によって決定されるとき、勾配流が方向収束することを示す。
我々の結果は、標本サイズによらず、幅が$tildemathcalO(r)$である、緩やかなオーバーパラメータ化をすでに維持しているかもしれない。
論文 参考訳(メタデータ) (2022-05-18T16:57:10Z) - Sharp asymptotics on the compression of two-layer neural networks [19.683271092724937]
我々は,Nノードを対象とする2層ニューラルネットワークを,Mノードを対象とする圧縮ネットワークに圧縮することを検討した。
最適最適化問題はEqui Tight Frame(ETF)の重み付けによって達成されると推測する。
論文 参考訳(メタデータ) (2022-05-17T09:45:23Z) - Scalable Deep Reinforcement Learning Algorithms for Mean Field Games [60.550128966505625]
平均フィールドゲーム (MFGs) は、非常に多くの戦略エージェントを持つゲームを効率的に近似するために導入された。
近年,モデルフリー強化学習(RL)手法を用いて,MFGの学習均衡の課題が活発化している。
MFGを解くための既存のアルゴリズムは戦略や$q$-valuesのような近似量の混合を必要とする。
本稿では,この欠点に対処する2つの手法を提案する。まず,歴史データの蒸留からニューラルネットワークへの混合戦略を学習し,Factitious Playアルゴリズムに適用する。
2つ目はオンライン混合方式である。
論文 参考訳(メタデータ) (2022-03-22T18:10:32Z) - Concave Utility Reinforcement Learning: the Mean-field Game viewpoint [42.403650997341806]
Concave Utility Reinforcement Learning (CURL) は、エージェントのポリシーによって引き起こされる占有度測定において、線形から凹凸ユーティリティまでRLを拡張する。
このより一般的なパラダイムは、古典的なベルマン方程式を無効にし、新しいアルゴリズムを要求する。
CURLは平均フィールドゲーム(MFG)のサブクラスであることを示す。
論文 参考訳(メタデータ) (2021-06-07T16:51:07Z) - Mean Field Game GAN [55.445402222849474]
新規な平均フィールドゲーム (MFGs) ベースのGAN (generation adversarial network) フレームワークを提案する。
密度空間における Hopf 式を利用して MFG を主双対問題として書き換え、ニューラルネットワークやサンプルを通じてモデルを訓練できるようにします。
論文 参考訳(メタデータ) (2021-03-14T06:34:38Z) - Regressive Domain Adaptation for Unsupervised Keypoint Detection [67.2950306888855]
ドメイン適応(DA)は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的とする。
本稿では,教師なしキーポイント検出のためのレグレッシブドメイン適応(RegDA)法を提案する。
提案手法は,異なるデータセット上のPCKにおいて,8%から11%の大幅な改善をもたらす。
論文 参考訳(メタデータ) (2021-03-10T16:45:22Z) - Connecting GANs, MFGs, and OT [4.530876736231948]
GAN(Generative Adversarial Network)は、画像生成と処理において大きな成功を収めている。
本稿では,平均場ゲーム(MFG)と最適輸送の観点からGANを解析する。
論文 参考訳(メタデータ) (2020-02-10T22:14:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。