論文の概要: Operator Learning for Families of Finite-State Mean-Field Games
- arxiv url: http://arxiv.org/abs/2602.13169v1
- Date: Fri, 13 Feb 2026 18:28:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:54.075796
- Title: Operator Learning for Families of Finite-State Mean-Field Games
- Title(参考訳): 有限状態平均フィールドゲームファミリに対する演算子学習
- Authors: William Hofgard, Asaf Cohen, Mathieu Laurière,
- Abstract要約: 有限状態平均場ゲーム(MFG)は、大きな相互作用粒子系の限界として生じる。
本稿では,MFGのパラメトリックファミリーを解く演算子学習フレームワークを提案する。
本手法の近似誤差,パラメトリック複雑性,一般化性能に関する理論的保証を提供する。
- 参考スコア(独自算出の注目度): 10.903750657949244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Finite-state mean-field games (MFGs) arise as limits of large interacting particle systems and are governed by an MFG system, a coupled forward-backward differential equation consisting of a forward Kolmogorov-Fokker-Planck (KFP) equation describing the population distribution and a backward Hamilton-Jacobi-Bellman (HJB) equation defining the value function. Solving MFG systems efficiently is challenging, with the structure of each system depending on an initial distribution of players and the terminal cost of the game. We propose an operator learning framework that solves parametric families of MFGs, enabling generalization without retraining for new initial distributions and terminal costs. We provide theoretical guarantees on the approximation error, parametric complexity, and generalization performance of our method, based on a novel regularity result for an appropriately defined flow map corresponding to an MFG system. We demonstrate empirically that our framework achieves accurate approximation for two representative instances of MFGs: a cybersecurity example and a high-dimensional quadratic model commonly used as a benchmark for numerical methods for MFGs.
- Abstract(参考訳): 有限状態平均場ゲーム(英: Finite-state mean-field game, MFGs)は、大きな相互作用する粒子系の極限として発生し、MFG系、人口分布を記述するコルモゴロフ・フォッカー・プランク(英: Kolmogorov-Fokker-Planck, KFP)方程式と、値関数を定義するハミルトン・ヤコビ・ベルマン(英: Hamilton-Jacobi-Bellman, HJB)方程式からなる結合前方微分方程式によって支配される。
MFGシステムを効率的に解くことは、プレイヤーの初期分布とゲームの端末コストによって、各システムの構造が異なり、困難である。
本稿では,MFGのパラメトリックファミリーを解決する演算子学習フレームワークを提案する。
MFGシステムに対応する適切に定義されたフローマップに対して,新しい正規化結果に基づいて近似誤差,パラメトリック複雑性,一般化性能を理論的に保証する。
我々は,MFGの2つの代表的な例として,サイバーセキュリティの例と,MFGの数値的手法のベンチマークとしてよく使用される高次元二次モデルについて,我々のフレームワークが正確な近似を実現することを実証的に実証した。
関連論文リスト
- High-dimensional Mean-Field Games by Particle-based Flow Matching [18.129646808071893]
平均場ゲーム(MFGs)は相互作用エージェントの連続体を持つ系のナッシュ平衡を研究する。
広い適用性にもかかわらず、高次元のMFGを解くことは、基本的な計算的および解析的障害のため重要な課題である。
本稿では,高次元MFGに対処する粒子ベースディープフローマッチング(FM)法を提案する。
論文 参考訳(メタデータ) (2025-12-01T01:04:53Z) - FMIP: Joint Continuous-Integer Flow For Mixed-Integer Linear Programming [52.52020895303244]
Mixed-Integer Linear Programming (MILP)は、複雑な意思決定問題の基本的なツールである。
混合整数線形計画法(FMIP)のための連立連続整数フローを提案する。これはMILPソリューションにおける整数変数と連続変数の共分散をモデル化する最初の生成フレームワークである。
FMIPは任意のバックボーンネットワークや様々なダウンストリームソルバと完全に互換性があり、現実世界のMILPアプリケーションにも適している。
論文 参考訳(メタデータ) (2025-07-31T10:03:30Z) - Stochastic Semi-Gradient Descent for Learning Mean Field Games with Population-Aware Function Approximation [16.00164239349632]
平均場ゲーム (MFGs) は人口分布を通した大規模マルチエージェントシステムにおける相互作用をモデル化する。
MFGの伝統的な学習方法は固定点反復(FPI)に基づいており、政策更新と人口分布を個別に逐次計算する。
本稿では,ゲーム力学を制御する統一パラメータとして,政策と人口を扱う新しい視点を提案する。
論文 参考訳(メタデータ) (2024-08-15T14:51:50Z) - Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL [57.745700271150454]
モデルに基づく関数近似を用いた平均フィールドゲーム(MFG)における強化学習のサンプル複雑性について検討した。
本稿では、モデルクラスの複雑性を特徴付けるためのより効果的な概念である部分モデルベースエルダー次元(P-MBED)を紹介する。
論文 参考訳(メタデータ) (2024-02-08T14:54:47Z) - On the Statistical Efficiency of Mean-Field Reinforcement Learning with General Function Approximation [20.66437196305357]
平均フィールド制御(MFC)および平均フィールドゲーム(MFG)における強化学習の基本統計的効率を一般モデルに基づく関数近似を用いて検討する。
我々は平均場モデルクラス固有の複雑さを特徴付ける平均場モデルベースエルダー次元(MF-MBED)という新しい概念を導入する。
論文 参考訳(メタデータ) (2023-05-18T20:00:04Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Efficient semidefinite-programming-based inference for binary and
multi-class MRFs [83.09715052229782]
分割関数やMAP推定をペアワイズMRFで効率的に計算する手法を提案する。
一般のバイナリMRFから完全多クラス設定への半定緩和を拡張し、解法を用いて再び効率的に解けるようなコンパクトな半定緩和を開発する。
論文 参考訳(メタデータ) (2020-12-04T15:36:29Z) - A General Framework for Learning Mean-Field Games [10.483303456655058]
本稿では,人口の多いゲームにおいて,同時学習と意思決定を同時に行う汎用平均場ゲーム(GMFG)フレームワークを提案する。
次に、スムーズなポリシーを持つ価値ベースおよびポリシーベースの強化学習アルゴリズムを提案する。
GMF-V-QとGMF-P-TRPO(GMF-VとGMF-Pの2つの特定のインスタンス化)とQラーニングとTRPOは、GMFG設定において効率的かつ堅牢であることを示した。
論文 参考訳(メタデータ) (2020-03-13T00:27:57Z) - Polynomial-Time Exact MAP Inference on Discrete Models with Global
Dependencies [83.05591911173332]
ジャンクションツリーアルゴリズムは、実行時の保証と正確なMAP推論のための最も一般的な解である。
本稿では,ノードのクローン化による新たなグラフ変換手法を提案する。
論文 参考訳(メタデータ) (2019-12-27T13:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。