論文の概要: Signatured Deep Fictitious Play for Mean Field Games with Common Noise
- arxiv url: http://arxiv.org/abs/2106.03272v1
- Date: Sun, 6 Jun 2021 23:09:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 17:23:16.524302
- Title: Signatured Deep Fictitious Play for Mean Field Games with Common Noise
- Title(参考訳): 共通雑音を持つ平均場競技におけるDeep Fictitious Play
- Authors: Ming Min, Ruimeng Hu
- Abstract要約: 平均場ゲーム(MFG)を共通のノイズで解くための既存のディープラーニング手法は、サンプリングされた共通のノイズパスを固定し、対応するMFGを解く。
そこで我々は,固定されていない共通雑音設定を用いてネストループ構造を回避できる新しい単一ループアルゴリズムを提案する。
提案アルゴリズムは,ニューラルネットワークのさらなるトレーニングを行うことなく,共通不確実性の変化が平均場平衡に与える影響を正確に把握することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing deep learning methods for solving mean-field games (MFGs) with
common noise fix the sampling common noise paths and then solve the
corresponding MFGs. This leads to a nested-loop structure with millions of
simulations of common noise paths in order to produce accurate solutions, which
results in prohibitive computational cost and limits the applications to a
large extent. In this paper, based on the rough path theory, we propose a novel
single-loop algorithm, named signatured deep fictitious play, by which we can
work with the unfixed common noise setup to avoid the nested-loop structure and
reduce the computational complexity significantly. The proposed algorithm can
accurately capture the effect of common uncertainty changes on mean-field
equilibria without further training of neural networks, as previously needed in
the existing machine learning algorithms. The efficiency is supported by three
applications, including linear-quadratic MFGs, mean-field portfolio game, and
mean-field game of optimal consumption and investment. Overall, we provide a
new point of view from the rough path theory to solve MFGs with common noise
with significantly improved efficiency and an extensive range of applications.
In addition, we report the first deep learning work to deal with extended MFGs
(a mean-field interaction via both the states and controls) with common noise.
- Abstract(参考訳): 平均場ゲーム(MFG)を共通のノイズで解くための既存のディープラーニング手法は、サンプリングされた共通のノイズパスを固定し、対応するMFGを解く。
これにより、共通のノイズパスの数百万のシミュレーションを持つネストされたループ構造が、正確な解を生み出すため、計算コストを制限し、アプリケーションを広範囲に制限する。
本稿では,大まかな経路理論を基礎として,固定されていない共有雑音設定と協調してネストされたループ構造を回避し,計算複雑性を著しく低減する,署名付き深層実演という新しい単一ループアルゴリズムを提案する。
提案アルゴリズムは、既存の機械学習アルゴリズムで必要とされるように、ニューラルネットワークのさらなるトレーニングをすることなく、平均場平衡に対する共通不確実性の変化の影響を正確に捉えることができる。
効率性は線形四角形MFG、平均場ポートフォリオゲーム、最適消費と投資の平均場ゲームを含む3つのアプリケーションによって支えられている。
全体として, 粗い経路理論からの新たな視点を提供し, 高い効率と広範囲の応用により, 共通の雑音を伴うmfgsの解法を提案する。
さらに,拡張MFG(状態と制御の両方による平均場相互作用)を共通の雑音で扱うための,最初の深層学習作業について報告する。
関連論文リスト
- Provably Efficient Information-Directed Sampling Algorithms for Multi-Agent Reinforcement Learning [50.92957910121088]
本研究は,情報指向サンプリング(IDS)の原理に基づくマルチエージェント強化学習(MARL)のための新しいアルゴリズムの設計と解析を行う。
エピソディックな2プレーヤゼロサムMGに対して、ナッシュ平衡を学習するための3つのサンプル効率アルゴリズムを提案する。
我々は、Reg-MAIDSをマルチプレイヤー汎用MGに拡張し、ナッシュ平衡または粗相関平衡をサンプル効率良く学習できることを証明する。
論文 参考訳(メタデータ) (2024-04-30T06:48:56Z) - Optimized Noise Suppression for Quantum Circuits [0.40964539027092917]
クロストークノイズは、例えば、クロス共鳴ベースの超伝導量子プロセッサにおける深刻なエラー源である。
Intrepidプログラミングアルゴリズムは、スワップ挿入によって最適化されたキュービットルーティングに関する以前の作業を拡張する。
最大127キュービットの2つのチップのクロストークノイズを特徴付けることで,提案手法の評価を行った。
論文 参考訳(メタデータ) (2024-01-12T07:34:59Z) - Learning Discrete-Time Major-Minor Mean Field Games [61.09249862334384]
本稿では,M3FG(Major-minor MFG)の新たな離散時間バージョンと,実演に基づく学習アルゴリズムを提案する。
M3FGは一般的な雑音でMFGを一般化し、ランダムな異種環境状態だけでなく、メジャープレイヤーも扱える。
論文 参考訳(メタデータ) (2023-12-17T18:22:08Z) - Layering and subpool exploration for adaptive Variational Quantum
Eigensolvers: Reducing circuit depth, runtime, and susceptibility to noise [0.0]
適応変分量子固有解法 (ADAPT-VQEs) は強い相関系のシミュレーションにおいて有望な候補である。
近年の取り組みは、アンザッツ回路のコンパクト化、または層化に向けられている。
層状化は振幅減衰や減音に対する耐雑音性の向上につながることを示す。
論文 参考訳(メタデータ) (2023-08-22T18:00:02Z) - Distributed Extra-gradient with Optimal Complexity and Communication
Guarantees [60.571030754252824]
複数のプロセッサ/ワーカー/クライアントがローカルなデュアルベクトルにアクセス可能なマルチGPU設定において、モノトン変分不等式(VI)問題を考察する。
モノトーンVI問題に対するデファクトアルゴリズムであるExtra-gradientは、通信効率が良くないように設計されている。
そこで本稿では,VI の解法に適した非バイアスで適応的な圧縮手法である量子化一般化外部勾配 (Q-GenX) を提案する。
論文 参考訳(メタデータ) (2023-08-17T21:15:04Z) - Learning in Congestion Games with Bandit Feedback [45.4542525044623]
我々は、良質な理論構造と広い実世界の応用を持つゲームのクラスである混雑ゲームについて検討する。
まず,渋滞ゲームにおける不確実性原理に直面する楽観性に基づく集中型アルゴリズムを提案する。
次に,Frank-Wolfe法とG-Optimal設計を組み合わせた分散アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-04T02:32:26Z) - Accelerating Noisy VQE Optimization with Gaussian Processes [0.0]
本稿では,ガウス過程(GP)をサロゲートモデルとして用いてノイズの影響を低減する。
ImFilは最先端で勾配のない手法であり、比較研究ではノイズの多いVQE問題よりも優れていることが示されている。
ノイズが存在する場合、GP+ImFilアプローチはスタンドアローンImFilよりも少ない評価で真の大域最小値に近い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-04-15T05:01:14Z) - Multiview point cloud registration with anisotropic and space-varying
localization noise [1.5499426028105903]
我々は,高異方性定位雑音で劣化した複数点の雲を登録する問題に対処する。
既存の手法は、空間不変等方性雑音の暗黙の仮定に基づいている。
ノイズハンドリング戦略は,高レベルの異方性雑音に対するロバスト性を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2022-01-03T15:21:24Z) - Learning based signal detection for MIMO systems with unknown noise
statistics [84.02122699723536]
本論文では,未知のノイズ統計による信号を堅牢に検出する一般化最大確率(ML)推定器を考案する。
実際には、システムノイズに関する統計的な知識はほとんどなく、場合によっては非ガウス的であり、衝動的であり、分析不可能である。
我々のフレームワークは、ノイズサンプルのみを必要とする教師なしの学習アプローチによって駆動される。
論文 参考訳(メタデータ) (2021-01-21T04:48:15Z) - Plug-And-Play Learned Gaussian-mixture Approximate Message Passing [71.74028918819046]
そこで本研究では,従来のi.i.d.ソースに適した圧縮圧縮センシング(CS)リカバリアルゴリズムを提案する。
我々のアルゴリズムは、Borgerdingの学習AMP(LAMP)に基づいて構築されるが、アルゴリズムに普遍的な復調関数を採用することにより、それを大幅に改善する。
数値評価により,L-GM-AMPアルゴリズムは事前の知識を必要とせず,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-11-18T16:40:45Z) - Non-Local Spatial Propagation Network for Depth Completion [82.60915972250706]
本研究では,深度完了のための堅牢で効率的な非局所的空間伝搬ネットワークを提案する。
提案するネットワークは,RGBとスパース深度画像を入力とし,各画素の非局所的近傍とその親和性を推定する。
提案アルゴリズムは,混合深度問題に対する深度補完精度とロバスト性の観点から,従来のアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-07-20T12:26:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。