論文の概要: Learning Surrogate Potential Mean Field Games via Gaussian Processes: A Data-Driven Approach to Ill-Posed Inverse Problems
- arxiv url: http://arxiv.org/abs/2502.11506v1
- Date: Mon, 17 Feb 2025 07:14:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:14:07.920585
- Title: Learning Surrogate Potential Mean Field Games via Gaussian Processes: A Data-Driven Approach to Ill-Posed Inverse Problems
- Title(参考訳): ガウス過程による潜在ポテンシャル平均場ゲーム学習:Ill-Posed Inverse問題に対するデータ駆動アプローチ
- Authors: Jingguo Zhang, Xianjin Yang, Chenchen Mou, Chao Zhou,
- Abstract要約: 平均場ゲーム(MFG)は相互作用するエージェントの集団行動を記述する。
我々は、エージェントの人口、運動量、環境設定を回復することを目的として、潜在的なMFGの逆問題に取り組む。
- 参考スコア(独自算出の注目度): 1.4325734372991794
- License:
- Abstract: Mean field games (MFGs) describe the collective behavior of large populations of interacting agents. In this work, we tackle ill-posed inverse problems in potential MFGs, aiming to recover the agents' population, momentum, and environmental setup from limited, noisy measurements and partial observations. These problems are ill-posed because multiple MFG configurations can explain the same data, or different parameters can yield nearly identical observations. Nonetheless, they remain crucial in practice for real-world scenarios where data are inherently sparse or noisy, or where the MFG structure is not fully determined. Our focus is on finding surrogate MFGs that accurately reproduce the observed data despite these challenges. We propose two Gaussian process (GP)-based frameworks: an inf-sup formulation and a bilevel approach. The choice between them depends on whether the unknown parameters introduce concavity in the objective. In the inf-sup framework, we use the linearity of GPs and their parameterization structure to maintain convex-concave properties, allowing us to apply standard convex optimization algorithms. In the bilevel framework, we employ a gradient-descent-based algorithm and introduce two methods for computing the outer gradient. The first method leverages an existing solver for the inner potential MFG and applies automatic differentiation, while the second adopts an adjoint-based strategy that computes the outer gradient independently of the inner solver. Our numerical experiments show that when sufficient prior information is available, the unknown parameters can be accurately recovered. Otherwise, if prior information is limited, the inverse problem is ill-posed, but our frameworks can still produce surrogate MFG models that closely match observed data.
- Abstract(参考訳): 平均場ゲーム(MFGs)は、相互作用するエージェントの集団行動を記述する。
本研究では, エージェントの個体数, 運動量, 環境設定を, 騒音, 部分的な観測から再現することを目的として, 潜在的なMFGの逆問題に対処する。
これらの問題は、複数のMFG構成が同じデータを説明できるか、または異なるパラメータがほぼ同一の観測結果をもたらす可能性があるため、不明確である。
それでも、データは本質的に疎かでノイズの多い現実のシナリオや、MFG構造が完全に決定されていない現実のシナリオにおいて、これらは依然として重要な存在である。
我々の焦点は、これらの課題にもかかわらず観測データを正確に再現するサロゲートMFGを見つけることである。
Inf-supの定式化とバイレベルアプローチという2つのガウスプロセス(GP)ベースのフレームワークを提案する。
それらの選択は、未知のパラメータが目的に凹凸をもたらすかどうかに依存する。
Inf-supフレームワークでは、GPの線形性とそのパラメータ化構造を用いて凸凹特性の維持を行い、標準凸最適化アルゴリズムを適用する。
両レベルフレームワークでは、勾配差に基づくアルゴリズムを用い、外勾配を計算する2つの方法を導入する。
第1の方法は、既存の内電位MFGの解法を利用し、自動微分を施し、第2の方法は、内電位MFGとは独立に外勾配を計算する随伴型戦略を採用する。
我々の数値実験は、十分な事前情報が得られれば、未知のパラメータを正確に復元できることを示している。
さもなければ、事前情報に制限がある場合、逆問題が発生するが、我々のフレームワークは観測データと密に一致した代理MFGモデルを生成することができる。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Rethinking the Diffusion Models for Numerical Tabular Data Imputation from the Perspective of Wasserstein Gradient Flow [13.109101873881063]
Kernelized Negative Entropy-regularized Wasserstein gradient flow Imputation (KnewImp) と呼ばれる原理的アプローチを導入する。
我々の提案するKnewImpアプローチは,既存の最先端手法を著しく上回っている。
論文 参考訳(メタデータ) (2024-06-22T06:59:32Z) - Score-based Diffusion Models in Function Space [137.70916238028306]
拡散モデルは、最近、生成モデリングの強力なフレームワークとして登場した。
この研究は、関数空間における拡散モデルをトレーニングするためのDDO(Denoising Diffusion Operators)と呼ばれる数学的に厳密なフレームワークを導入する。
データ解像度に依存しない固定コストで、対応する離散化アルゴリズムが正確なサンプルを生成することを示す。
論文 参考訳(メタデータ) (2023-02-14T23:50:53Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Gleo-Det: Deep Convolution Feature-Guided Detector with Local Entropy
Optimization for Salient Points [5.955667705173262]
本稿では, 深い畳み込み特徴のガイダンスを伴い, 繰り返し可能性の要求に基づき, きめ細かな制約を実現することを提案する。
畳み込み特徴のガイダンスを用いて、正と負の両面からコスト関数を定義する。
論文 参考訳(メタデータ) (2022-04-27T12:40:21Z) - Inverting brain grey matter models with likelihood-free inference: a
tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。
我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。
次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文 参考訳(メタデータ) (2021-11-15T09:08:27Z) - Learning Functional Priors and Posteriors from Data and Physics [3.537267195871802]
我々は、歴史的データを用いて時空の露光を可能にするディープニューラルネットワークに基づく新しいフレームワークを開発した。
物理インフォームド・ジェネレーティブ・アダクティブ・アダクティブ・ネットワーク(PI-GAN)を用いて機能的事前学習を行う。
第2段階では, PI-GANの潜伏空間の後方を推定するために, ハミルトニアンモンテカルロ法(HMC)を用いる。
論文 参考訳(メタデータ) (2021-06-08T03:03:24Z) - Self-Concordant Analysis of Generalized Linear Bandits with Forgetting [2.282313031205821]
ポアソンウィンドウや指数重みを用いた自己調和型GLB(ロジスティック回帰を含む)に焦点を当てる。
本稿では,GLB(Generalized Bandits)問題に対処するためのアプローチを提案する。
論文 参考訳(メタデータ) (2020-11-02T08:36:39Z) - Global Convergence of Policy Gradient for Linear-Quadratic Mean-Field
Control/Game in Continuous Time [109.06623773924737]
線形二乗平均場制御とゲームに対するポリシー勾配法について検討する。
線形速度で最適解に収束し, 合成シミュレーションにより検証した。
論文 参考訳(メタデータ) (2020-08-16T06:34:11Z) - Exponentially Weighted l_2 Regularization Strategy in Constructing
Reinforced Second-order Fuzzy Rule-based Model [72.57056258027336]
従来の高木スゲノカン(TSK)型ファジィモデルでは、定数あるいは線形関数がファジィ規則の連続部分として使用されるのが普通である。
調和解析で遭遇する重み関数理論にインスパイアされた指数重みアプローチを導入する。
論文 参考訳(メタデータ) (2020-07-02T15:42:15Z) - Unified Reinforcement Q-Learning for Mean Field Game and Control
Problems [0.0]
本稿では、無限水平平均場ゲーム(MFG)と平均場制御(MFC)問題を解決するために強化学習(RL)アルゴリズムを提案する。
このアルゴリズムは,2つの学習パラメータの比率を単純に調整することで,MFGとMFCのどちらでも学習することができる。
論文 参考訳(メタデータ) (2020-06-24T17:45:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。