論文の概要: Exploration noise for learning linear-quadratic mean field games
- arxiv url: http://arxiv.org/abs/2107.00839v1
- Date: Fri, 2 Jul 2021 05:18:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 01:36:41.116309
- Title: Exploration noise for learning linear-quadratic mean field games
- Title(参考訳): 線形4次平均場ゲーム学習のための探索ノイズ
- Authors: Fran\c{c}ois Delarue and Athanasios Vasileiadis
- Abstract要約: 一般的なノイズは、平均フィールドゲームの解を学ぶための探索ノイズとして機能する。
我々は、同じ種類の共通雑音が、架空の遊びと呼ばれる学習アルゴリズムの収束を強いる可能性があることを証明している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The goal of this paper is to demonstrate that common noise may serve as an
exploration noise for learning the solution of a mean field game. This concept
is here exemplified through a toy linear-quadratic model, for which a suitable
form of common noise has already been proven to restore existence and
uniqueness. We here go one step further and prove that the same form of common
noise may force the convergence of the learning algorithm called `fictitious
play', and this without any further potential or monotone structure. Several
numerical examples are provided in order to support our theoretical analysis.
- Abstract(参考訳): 本研究の目的は, 平均フィールドゲームの解法を学ぶための探索ノイズとして, 共通雑音が有効であることを示すことである。
この概念は、一般的な雑音の適切な形が、存在と特異性を復元することがすでに証明されている、おもちゃの線形四角形モデルによって実証されている。
ここではさらに一歩進んで、同じ種類の共通雑音が「架空の遊び」と呼ばれる学習アルゴリズムの収束を招きかねないことを証明し、これはさらなるポテンシャルや単調な構造を伴わない。
理論解析を支えるためにいくつかの数値例が提供されている。
関連論文リスト
- The Crystal Ball Hypothesis in diffusion models: Anticipating object positions from initial noise [92.53724347718173]
拡散モデルはテキスト・画像生成タスクにおいて顕著な成功を収めた。
我々は、初期ノイズ画像内の特定の領域をトリガーパッチと呼び、結果として発生する画像のオブジェクト生成に重要な役割を果たす。
論文 参考訳(メタデータ) (2024-06-04T05:06:00Z) - One Noise to Rule Them All: Learning a Unified Model of Spatially-Varying Noise Patterns [33.293193191683145]
本稿では,複数種類のノイズを生成できる単一生成モデルを提案する。
また, 逆手続き材料設計の改善に本モデルを適用した。
論文 参考訳(メタデータ) (2024-04-25T02:23:11Z) - The Discrete Noise Approximation in Quantum Circuits [0.0]
量子回路の実装において,量子デバイス上で発生する雑音過程について検討する。
クビットレジスタの十分に大きな回転に対応するゲートに対して、これらのノイズ項の定性的性質は、基礎となるハードウェアレベルでのノイズの性質と大きく異なることが分かる。
論文 参考訳(メタデータ) (2023-10-31T20:17:08Z) - Causal Discovery with Score Matching on Additive Models with Arbitrary
Noise [37.13308785728276]
因果発見法は、構造識別可能性を保証するために必要な仮定のセットによって本質的に制約される。
本稿では,雑音項のガウス性に反するエッジ反転のリスクを解析し,この仮説の下での推論の欠点を示す。
本稿では,一般的な雑音分布を持つ付加非線形モデルに基づいて生成されたデータから,因果グラフ内の変数の位相的順序付けを推定する新しい手法を提案する。
これは、最小限の仮定と、合成データに基づいて実験的にベンチマークされた技術性能の状態を持つ因果探索アルゴリズムであるNoGAMに繋がる。
論文 参考訳(メタデータ) (2023-04-06T17:50:46Z) - Positive-incentive Noise [91.3755431537592]
騒音は様々な分野、例えば工学や学習システムにおいて深刻な問題と見なされている。
本稿では,従来の提案が常に成立するかどうかを検討することを目的とする。
$pi$-noiseは、いくつかのモデルに新しい説明を提供し、マルチタスク学習や逆トレーニングなど、いくつかの分野に新しい原則を提供する。
論文 参考訳(メタデータ) (2022-12-19T15:33:34Z) - Deep Active Learning with Noise Stability [24.54974925491753]
ラベルのないデータの不確実性推定は、アクティブな学習に不可欠である。
本稿では,雑音の安定性を利用して不確実性を推定する新しいアルゴリズムを提案する。
本手法はコンピュータビジョン,自然言語処理,構造データ解析など,様々なタスクに適用可能である。
論文 参考訳(メタデータ) (2022-05-26T13:21:01Z) - The Optimal Noise in Noise-Contrastive Learning Is Not What You Think [80.07065346699005]
この仮定から逸脱すると、実際により良い統計的推定結果が得られることが示される。
特に、最適な雑音分布は、データと異なり、また、別の家族からさえも異なる。
論文 参考訳(メタデータ) (2022-03-02T13:59:20Z) - A Free Lunch from the Noise: Provable and Practical Exploration for
Representation Learning [55.048010996144036]
ある雑音仮定の下では、対応するマルコフ遷移作用素の線型スペクトル特性を自由な閉形式で得られることを示す。
本稿では,スペクトルダイナミクス埋め込み(SPEDE)を提案する。これはトレードオフを破り,雑音の構造を利用して表現学習のための楽観的な探索を完遂する。
論文 参考訳(メタデータ) (2021-11-22T19:24:57Z) - Simultaneous Reconstruction and Uncertainty Quantification for
Tomography [0.0]
基底的真理がなければ、解の質の定量化は非常に望ましいが、未探索である。
本研究では,ガウス過程のモデリングを通じて,サンプル特徴や実験ノイズの事前知識を柔軟かつ明示的に取り入れることによって,この問題に対処する。
提案手法は,既存手法に匹敵する再構成だけでなく,解の不確かさの定量化にも有効である。
論文 参考訳(メタデータ) (2021-03-29T18:16:57Z) - Learning with Group Noise [106.56780716961732]
グループノイズを用いた学習のための新しいマックスマッチング手法を提案する。
いくつかの学習パラダイムの領域における実世界のデータセットのレンジのパフォーマンスは、Max-Matchingの有効性を示している。
論文 参考訳(メタデータ) (2021-03-17T06:57:10Z) - Contextual Linear Bandits under Noisy Features: Towards Bayesian Oracles [65.9694455739978]
特徴不確実性の下での文脈線形帯域問題について検討する。
本分析により, 最適仮説は, 雑音特性に応じて, 基礎となる実現可能性関数から著しく逸脱しうることが明らかとなった。
これは、古典的アプローチが非自明な後悔境界を保証できないことを意味する。
論文 参考訳(メタデータ) (2017-03-03T21:39:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。