論文の概要: Kernel-based potential mean-field games with unbiased random Fourier $U$-statistics
- arxiv url: http://arxiv.org/abs/2605.29371v1
- Date: Thu, 28 May 2026 05:15:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.754064
- Title: Kernel-based potential mean-field games with unbiased random Fourier $U$-statistics
- Title(参考訳): Unbiased random Fourier $U$-statistics を用いたカーネルベース潜在平均場ゲーム
- Authors: Yumiharu Nakano,
- Abstract要約: 本研究では,カーネルの最大平均不一致を再現することで,ランニング・インタラクション・コストと終端目標コストの両方を表現できる潜在平均場ゲームのサブクラスについて検討する。
どちらのコストも、ランダムなフーリエU統計表現を用いて有限サンプル経験分布から推定される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the subclass of potential mean-field games in which the running interaction cost and the terminal target cost are both expressed through reproducing-kernel maximum mean discrepancy (MMD) penalties, and develop a computational framework that exploits this kernel structure. Both costs are estimated from finite-sample empirical distributions using a random Fourier U-statistic representation that is unbiased and has linear cost in the batch size. The drift of the controlled diffusion is parametrized by a neural network and trained via stochastic gradient descent. For this subclass we prove a sample-level almost-sure convergence theorem and an explicit almost-sure rate of convergence, under coupled rate conditions on the penalty parameter, the random-feature count, the sample size, and the optimization tolerance. The framework includes the kernel-MMD-penalty Schrödinger bridge problem as the special case of a vanishing interaction cost. Numerical experiments illustrate the method on the Schrödinger bridge problem in dimensions up to one hundred, and on an electric vehicle charging coordination problem with per-vehicle physical heterogeneity, where an aggregate-demand congestion cost represents price-feedback competition at the population level and the terminal MMD penalty shapes the state-of-charge distribution at the deadline.
- Abstract(参考訳): ランニング・インタラクション・コストと終端目標コストの両方が再生カーネル最大平均誤差(MMD)ペナルティによって表現される潜在平均フィールドゲームのサブクラスについて検討し、このカーネル構造を利用する計算フレームワークを開発する。
どちらのコストも、ランダムなフーリエU統計表現を用いて有限サンプル経験分布から推定される。
制御された拡散のドリフトはニューラルネットワークによってパラメータ化され、確率勾配降下によって訓練される。
このサブクラスに対して、サンプルレベルの概日収束定理と明示的な概日収束率を、ペナルティパラメータ、乱数数、サンプルサイズ、および最適化耐性の結合率条件下で証明する。
このフレームワークは、カーネル-MMD-ペナルティ・シュレーディンガー橋の問題を含む。
数値実験では、シュレーディンガー橋の問題(最大100次元)と、車種ごとの物理的不均一性を伴う電気自動車充電調整問題(人口レベルでの総需要混雑コストが価格-フィードバック競争を表し、終端MDペナルティが期限時に電荷分布を形作る)について説明する。
関連論文リスト
- Convergence, design and training of continuous-time dropout as a random batch method [0.0]
ランダムバッチ方式のレンズを用いた連続時間モデルにおけるドロップアウト正規化について検討する。
我々は、長さ$h$の時間間隔でニューロンのバッチをサンプリングすることによって、ドロップアウトを模倣する、偏りのない、よく考えられた推定器を構築した。
次に、単層ニューラルネットワークを専門とし、分類とフローマッチングの理論を検証する。
論文 参考訳(メタデータ) (2025-10-15T04:19:01Z) - Driving a Quantum Phase Transition at Arbitrary Rate: Exact solution of the Transverse-Field Ising model [0.0]
磁場後における横磁場イジングモデルにおける量子相転移の交叉を任意の速度で検討する。
線形化クエンチの完了時に, 欠陥密度, 完備kink数分布, 累積量を解析した。
論文 参考訳(メタデータ) (2025-01-16T19:03:37Z) - Non-asymptotic bounds for forward processes in denoising diffusions: Ornstein-Uhlenbeck is hard to beat [49.1574468325115]
本稿では,全変動(TV)における前方拡散誤差の非漸近的境界について述べる。
我々は、R$からFarthestモードまでの距離でマルチモーダルデータ分布をパラメライズし、加法的および乗法的雑音による前方拡散を考察する。
論文 参考訳(メタデータ) (2024-08-25T10:28:31Z) - Soft-constrained Schrodinger Bridge: a Stochastic Control Approach [4.922305511803267]
シュル「オーディンガー橋」は、最適に制御された拡散過程を見つけることを目標とする連続時間制御問題と見なすことができる。
本稿では,両分布間のKulback-Leiblerの相違を罰し,端末分布を目標と異なるものにすることで,この問題を一般化することを提案する。
1つの応用は、堅牢な生成拡散モデルの開発である。
論文 参考訳(メタデータ) (2024-03-04T04:10:24Z) - TIC-TAC: A Framework for Improved Covariance Estimation in Deep Heteroscedastic Regression [109.69084997173196]
奥行き回帰は、予測分布の平均と共分散を負の対数類似度を用いて共同最適化する。
近年の研究では, 共分散推定に伴う課題により, 準最適収束が生じる可能性が示唆されている。
1)予測共分散は予測平均のランダム性を真に捉えているか?
その結果, TICは共分散を正確に学習するだけでなく, 負の対数類似性の収束性の向上も促進することがわかった。
論文 参考訳(メタデータ) (2023-10-29T09:54:03Z) - Importance sampling for stochastic quantum simulations [68.8204255655161]
我々は、係数に応じてハミルトン式からサンプリングしてランダムな積公式を構築するqDriftプロトコルを導入する。
サンプリング段階における個別のシミュレーションコストを考慮し、同じ精度でシミュレーションコストを削減可能であることを示す。
格子核効果場理論を用いて数値シミュレーションを行った結果, 実験結果が得られた。
論文 参考訳(メタデータ) (2022-12-12T15:06:32Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - Convergence of Gaussian-smoothed optimal transport distance with
sub-gamma distributions and dependent samples [12.77426855794452]
本稿では,より一般的な設定下でのGOT距離を推定するための収束保証を提供する。
我々の分析における重要なステップは、GOT距離がカーネルの最大誤差距離の族に支配されていることを示すことである。
論文 参考訳(メタデータ) (2021-02-28T04:30:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。