論文の概要: Bench-MFG: A Benchmark Suite for Learning in Stationary Mean Field Games
- arxiv url: http://arxiv.org/abs/2602.12517v1
- Date: Fri, 13 Feb 2026 01:49:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:53.805385
- Title: Bench-MFG: A Benchmark Suite for Learning in Stationary Mean Field Games
- Title(参考訳): Bench-MFG: 定位平均フィールドゲームにおける学習のためのベンチマークスイート
- Authors: Lorenzo Magnino, Jiacheng Shen, Matthieu Geist, Olivier Pietquin, Mathieu Laurière,
- Abstract要約: Mean Field Games (MFGs) とReinforcement Learning (RL) は、大規模マルチエージェントシステムを解くために設計されたアルゴリズム群を育んでいる。
この分野では現在、標準化された評価プロトコルが欠如しており、研究者は目覚まし、孤立し、しばしば単純化された環境に頼らざるを得ない。
本稿では,離散時間,離散空間,定常設定に着目したMFG(Bench-MFG)の総合ベンチマークスイートを提案する。
- 参考スコア(独自算出の注目度): 29.320693556478858
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The intersection of Mean Field Games (MFGs) and Reinforcement Learning (RL) has fostered a growing family of algorithms designed to solve large-scale multi-agent systems. However, the field currently lacks a standardized evaluation protocol, forcing researchers to rely on bespoke, isolated, and often simplistic environments. This fragmentation makes it difficult to assess the robustness, generalization, and failure modes of emerging methods. To address this gap, we propose a comprehensive benchmark suite for MFGs (Bench-MFG), focusing on the discrete-time, discrete-space, stationary setting for the sake of clarity. We introduce a taxonomy of problem classes, ranging from no-interaction and monotone games to potential and dynamics-coupled games, and provide prototypical environments for each. Furthermore, we propose MF-Garnets, a method for generating random MFG instances to facilitate rigorous statistical testing. We benchmark a variety of learning algorithms across these environments, including a novel black-box approach (MF-PSO) for exploitability minimization. Based on our extensive empirical results, we propose guidelines to standardize future experimental comparisons. Code available at \href{https://github.com/lorenzomagnino/Bench-MFG}{https://github.com/lorenzomagnino/Bench-MFG}.
- Abstract(参考訳): MFG(Mean Field Games)と強化学習(Reinforcement Learning, RL)の交差点は、大規模マルチエージェントシステムを解くために設計されたアルゴリズム群を育んでいる。
しかし、この分野では現在標準化された評価プロトコルが欠如しており、研究者は目立ち、孤立し、しばしば単純化された環境に頼らざるを得ない。
この断片化は、新興メソッドの堅牢性、一般化、障害モードを評価するのを難しくする。
このギャップに対処するために,離散時間,離散空間,定常条件に着目したMFGの総合ベンチマークスイート(Bench-MFG)を提案する。
我々は,非相互作用ゲームやモノトーンゲームからポテンシャルゲームや動的結合ゲームまで,問題クラスの分類を導入し,それぞれにプロトタイプ環境を提供する。
さらに、厳密な統計的テストを容易にするために、ランダムなMFGインスタンスを生成する方法であるMF-Garnetsを提案する。
我々はこれらの環境にまたがる様々な学習アルゴリズムをベンチマークし、新しいブラックボックスアプローチ (MF-PSO) をエクスプロイラビリティーの最小化に適用した。
実験結果に基づいて,今後の比較実験を標準化するためのガイドラインを提案する。
コードは \href{https://github.com/lorenzomagnino/Bench-MFG}{https://github.com/lorenzomagnino/Bench-MFG} で公開されている。
関連論文リスト
- Solving Continuous Mean Field Games: Deep Reinforcement Learning for Non-Stationary Dynamics [4.4685491639611685]
メアンフィールドゲーム(MFG)は、大規模マルチエージェントシステムにおけるインタラクションをモデル化するための強力なフレームワークとして登場した。
本稿では,非定常連続MFGに特化して設計された新しい深部強化学習(DRL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-10-25T04:50:52Z) - Demystifying Online Clustering of Bandits: Enhanced Exploration Under Stochastic and Smoothed Adversarial Contexts [27.62165569135504]
バンディットのオンラインクラスタリングとして知られる一連の研究は、類似のユーザをクラスタにグループ化することで、コンテキストMABを拡張している。
既存のアルゴリズムは、上位信頼境界(UCB)戦略に依存しており、未知のユーザクラスタを正確に識別するために十分な統計情報を集めるのに苦労している。
クラスタ識別を高速化する探索機構を改良した,UniCLUB と PhaseUniCLUB の2つの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-01-01T16:38:29Z) - POGEMA: A Benchmark Platform for Cooperative Multi-Agent Pathfinding [76.67608003501479]
POGEMAは、学習のための高速環境、問題インスタンスジェネレータ、可視化ツールキットを含む、総合的なツールセットである。
また、プライマリ評価指標に基づいて計算されるドメイン関連メトリクスの範囲を規定する評価プロトコルを導入し、定義する。
この比較の結果は、様々な最先端のMARL、検索ベース、ハイブリッド手法を含む。
論文 参考訳(メタデータ) (2024-07-20T16:37:21Z) - Analysing the Sample Complexity of Opponent Shaping [15.226375898939205]
一般サムゲームでの学習は、しばしば集合的な準最適結果をもたらす。
初期の対戦型シェーピング(OS)法では、高階微分を用いてコプレイヤーの学習を形作る。
M-FOS(M-free Opponent Shaping)は、OSの問題をメタゲームとして再定義することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2024-02-08T16:17:18Z) - Learning Discrete-Time Major-Minor Mean Field Games [61.09249862334384]
本稿では,M3FG(Major-minor MFG)の新たな離散時間バージョンと,実演に基づく学習アルゴリズムを提案する。
M3FGは一般的な雑音でMFGを一般化し、ランダムな異種環境状態だけでなく、メジャープレイヤーも扱える。
論文 参考訳(メタデータ) (2023-12-17T18:22:08Z) - Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。
EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。
得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文 参考訳(メタデータ) (2023-12-10T15:22:30Z) - Exponentially Convergent Algorithms for Supervised Matrix Factorization [2.1485350418225244]
Supervised Factorization (SMF) は、抽出タスクと分類タスクを集約する機械学習手法である。
本稿では,組合わせ係数空間推定における低ランク推定問題としてSMFを'リフト'する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-18T23:24:02Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - FedRC: Tackling Diverse Distribution Shifts Challenge in Federated Learning by Robust Clustering [4.489171618387544]
Federated Learning(FL)は、エッジデバイス上でクライアントデータを保持することによって、プライバシを保護する機械学習パラダイムである。
本稿では,多様な分布シフトの同時発生による学習課題を特定する。
提案するクラスタリングの原理に従う新しいクラスタリングアルゴリズムフレームワークであるFedRCを提案する。
論文 参考訳(メタデータ) (2023-01-29T06:50:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。