Fugu-MT 論文翻訳(概要): Sink equilibria and the attractors of learning in games

論文の概要: Sink equilibria and the attractors of learning in games

arxiv url: http://arxiv.org/abs/2502.07975v3
Date: Sun, 26 Oct 2025 21:18:47 GMT
ステータス: 翻訳完了
システム内更新日: 2025-10-28 15:28:14.298105
Title: Sink equilibria and the attractors of learning in games
Title（参考訳）: ゲームにおけるシンク均衡と学習の魅力
Authors: Oliver Biggar, Christos Papadimitriou,
Abstract要約: 1$1の予想は偽であることを示す。制限行動の特徴付けはゲーム理論における最も基本的なオープンな問題の一つである。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Characterizing the limit behavior -- that is, the attractors -- of learning dynamics is one of the most fundamental open questions in game theory. In recent work on this front, it was conjectured that the attractors of the replicator dynamic are in one-to-one correspondence with the sink equilibria of the game -- the sink strongly connected components of a game's preference graph -- , and it was established that they do stand in at least one-to-many correspondence with them. Here, we show that the one-to-one conjecture is false. We disprove this conjecture over the course of three theorems: the first disproves a stronger form of the conjecture, while the weaker form is disproved separately in the two-player and $N$-player ($N>2$) cases. By showing how the conjecture fails, we lay out the obstacles that lie ahead for characterizing attractors of the replicator, and introduce new ideas with which to tackle them. All three counterexamples derive from an object called a local source -- a point lying within the sink equilibrium, and yet which is `locally repelling'; we prove that the absence of local sources is necessary, but not sufficient, for the one-to-one property to be true. We complement this with a sufficient condition: we introduce a local property of a sink equilibrium called pseudoconvexity, and establish that when the sink equilibria of a two-player game are pseudoconvex then they precisely define the attractors. Pseudoconvexity generalizes the previous cases -- such as zero-sum games and potential games -- where this conjecture was known to hold, and reformulates these cases in terms of a simple graph property.
Abstract（参考訳）: ゲーム理論において、学習力学の限界行動(すなわち、引き付け子)を特徴づけることは、最も基本的なオープンな質問の1つである。近年の研究では、レプリケータのダイナミックな魅力はゲームのシンク平衡(ゲームの嗜好グラフのシンクと強く結びついているコンポーネント)と1対1の対応にあると推測され、それらと少なくとも1対1の対応で立つことが確立された。ここでは、1対1の予想が偽であることを示す。第一は予想のより強い形式を証明し、弱い形式は2つのプレイヤーと$N$-player$N>2$のケースで別々に証明される。予想がどのように失敗するかを示すことによって、複製子の誘引者を特徴づけるために前方にある障害をレイアウトし、それらに取り組むための新しいアイデアを導入する。これら3つの反例はいずれも、シンク平衡内にある点である局所源と呼ばれる物体に由来するが、それは「局所的な反発」であり、局所源の欠如は必要であるが、1対1の性質が真であることを証明する。擬凸性と呼ばれるシンク均衡の局所性を導入し、2人のプレイヤゲームのシンク平衡が擬凸であるとき、それらが正確に誘引子を定義する。擬凸性(英語版)(Pseudoconvexity)は、ゼロサムゲーム(英語版)やポテンシャルゲーム(英語版)のような以前のケースを一般化し、この予想が成り立つことが知られており、単純なグラフの性質の観点からこれらのケースを再構成する。

関連論文リスト

Model as a Game: On Numerical and Spatial Consistency for Generative Games [117.36098212829766]
本稿では,モデル・アズ・ア・ゲーム(MaaG)のメカニズムを十分に構築した上で,モデル・アズ・ア・ゲーム(MaaG)を真に構成するものを探るため,生成ゲームのパラダイムを再考する。 DiTアーキテクチャに基づいて,(1) LogicNetを統合してイベントトリガを決定する数値モジュール,(2) 探索領域のマップを維持する空間モジュール,(2) 生成中の位置情報を検索して連続性を確保する,という2つの特殊なモジュールを設計する。
論文参考訳（メタデータ） (2025-03-27T05:46:15Z)
Braiding for the win: Harnessing braiding statistics in topological states to win quantum games [0.23301643766310368]
非局所量子ゲームは、量子資源が特定のタスクで有利に働くという原理の証明を提供する。本研究では, リソース状態の小さな変形に対して頑健な, ある非局所的なゲームに対して, トーリックなコードリソース状態が有利であることを示す。パラダイムトポロジカルおよびフラクトン秩序相から他のいくつかの状態が、適切に定義された非局所ゲームのためのリソースとして機能することを示す。
論文参考訳（メタデータ） (2024-12-18T19:30:30Z)
Swim till You Sink: Computing the Limit of a Game [26.785274326413585]
本研究では,ノイズレプリケータ力学と呼ばれる自然力学のクラスにおける挙動の計算問題について検討する。実験により, 標本化とシミュレーションにより, 合理的な大ゲームの限界分布を正確に推定できることを示した。
論文参考訳（メタデータ） (2024-08-20T19:09:21Z)
A geometric decomposition of finite games: Convergence vs. recurrence under exponential weights [24.800126996235512]
ゲームは、ダイナミクスの長時間動作がよく理解されている単純なコンポーネントに分解する。特に指数的/乗法的重み(EW)スキームの力学はヘルムホルツの定理のユークリッドアンダーピンニングとは相容れない。我々は、よく知られたゲームの分解と、ポテンシャルおよび調和成分への深い関係を確立する。
論文参考訳（メタデータ） (2024-05-12T08:58:35Z)
The Möbius game and other Bell tests for relativity [0.0]
勝利確率が一定の限界を超えた場合、パーティーの因果関係と部分順序が一致しないことを証明できる多人数ゲームが導出される。一般相対性理論において、これらのゲームは時空の動的性質をデバイスに依存しないテストとして論じる。
論文参考訳（メタデータ） (2023-09-27T16:08:13Z)
On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文参考訳（メタデータ） (2023-01-26T17:25:45Z)
Reasoning about Causality in Games [63.930126666879396]
因果推論とゲーム理論推論は人工知能の基本的なトピックである。本稿では,エージェントの意思決定ルールとゲームを管理する分布の依存関係をエンコードするメカニケードゲームを紹介する。因果ゲームと他の形式主義の対応を記述し、他の因果ゲームやゲーム理論モデルがサポートしていない問合せにどのように因果ゲームが使えるかを説明する。
論文参考訳（メタデータ） (2023-01-05T22:47:28Z)
Counterexamples in self-testing [0.0]
非ローカルゲームにおける自己テストについて検討する。特に、ある特定の量子状態の存在を証明した量子優位性を持つ2党の非局所ゲームやベルの不等式は、すべて不等式であるだろうか? 私たちのカウンターサンプルは、独立した関心を持つゲームのクラスに基づいています。
論文参考訳（メタデータ） (2022-12-22T09:52:18Z)
Finding mixed-strategy equilibria of continuous-action games without gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文参考訳（メタデータ） (2022-11-29T05:16:41Z)
Connes implies Tsirelson: a simple proof [91.3755431537592]
コンヌ埋め込み問題は同期的ツィレルソン予想を意味することを示す。また、コンネスの代数 $mathcalRomega$ の異なる構成もコンネス埋め込み問題に現れる。
論文参考訳（メタデータ） (2022-09-16T13:59:42Z)
Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文参考訳（メタデータ） (2022-08-22T08:31:46Z)
Evolutionary Game-Theoretical Analysis for General Multiplayer Asymmetric Games [22.753799819424785]
不正確さなしに、ペイオフテーブルと動的分析のギャップを埋める。いくつかの古典ゲームにおいて,本手法を最先端のゲームと比較する。
論文参考訳（メタデータ） (2022-06-22T14:06:23Z)
Proofs of network quantum nonlocality aided by machine learning [68.8204255655161]
我々は[DOI40103/PhysRevLett.123.140]の量子三角形分布の族が、元の証明よりも広い範囲の三角形局所モデルを認めていないことを示した。我々は、独立な利害関係を持つ二項結果を持つ三角形のシナリオに対して、ネットワークベルの不等式を大量に収集する。
論文参考訳（メタデータ） (2022-03-30T18:00:00Z)
Bounded rationality for relaxing best response and mutual consistency: An information-theoretic model of partial self-reference [0.0]
この研究は、相互整合性やベストレスポンスなど、合理的性の前提となるいくつかの仮定に焦点を当てている。我々は、レベル-$k$推論と量子応答平衡(QRE)の概念を用いて、これらの仮定を緩和する方法を検討する。
論文参考訳（メタデータ） (2021-06-30T06:56:56Z)
Sample-Efficient Learning of Stackelberg Equilibria in General-Sum Games [78.65798135008419]
一般的なゲームでStackelberg平衡を効率的に学習する方法は、サンプルから非常にオープンなままです。本稿では,2プレーヤターンベース汎用ゲームにおけるStackelberg平衡のサンプル効率学習に関する理論的研究を開始する。
論文参考訳（メタデータ） (2021-02-23T05:11:07Z)
Fundamental Limits and Tradeoffs in Invariant Representation Learning [99.2368462915979]
多くの機械学習アプリケーションは、2つの競合する目標を達成する表現を学習する。ミニマックスゲーム理論の定式化は、精度と不変性の基本的なトレードオフを表す。分類と回帰の双方において,この一般的かつ重要な問題を情報論的に解析する。
論文参考訳（メタデータ） (2020-12-19T15:24:04Z)
Hindsight and Sequential Rationality of Correlated Play [18.176128899338433]
私たちは、修正された振る舞いで達成できたことに対して、強いパフォーマンスを後見で保証するアルゴリズムを検討します。我々は,学習の隠れた枠組みを,逐次的な意思決定の場で開発し,提唱する。本稿では,それぞれの平衡の強さと弱さを文献に示す例を示す。
論文参考訳（メタデータ） (2020-12-10T18:30:21Z)
No-regret learning and mixed Nash equilibria: They do not mix [64.37511607254115]
我々はFTRL(Follow-the-regularized-leader)のダイナミクスについて検討する。厳密でないナッシュ均衡は、FTRLの下で安定して引き寄せることは不可能である。この結果は,学習過程の結果を予測する上で重要な意味を持つ。
論文参考訳（メタデータ） (2020-10-19T13:49:06Z)
Chaos, Extremism and Optimism: Volume Analysis of Learning in Games [55.24050445142637]
本稿では,ゼロサムにおける乗算重み更新 (MWU) と最適乗算重み更新 (OMWU) のボリューム解析と協調ゲームについて述べる。我々は、OMWUが、その既知の収束挙動の代替的な理解を提供するために、ボリュームを契約していることを示します。我々はまた、コーディネートゲームを調べる際に役割が逆になるという意味で、自由ランチ型の定理も証明する: OMWU は指数関数的に高速に体積を拡大するが、MWU は契約する。
論文参考訳（メタデータ） (2020-05-28T13:47:09Z)
Ex ante versus ex post equilibria in classical Bayesian games with a nonlocal resource [0.0]
非局所資源の助けを借りてプレイされる古典ゲームにおけるex anteとex post equilibriaの違いを分析する。 V'ertesi と Bene によるベル理論に基づく新しいタイプのゲームを導入する。
論文参考訳（メタデータ） (2020-05-26T13:53:56Z)
Real World Games Look Like Spinning Tops [27.182163984605193]
本稿では,実世界のゲーム(例えば,Tic-Tac-Toe,Go,StarCraft II)の幾何学的性質について検討する。それらの幾何学構造は回転するトップに似ていると仮定する。我々は、この幾何学が現実世界のゲームに広く存在することを証明し、その時間的性質を明らかにする。エージェントの訓練に戦略の人口がなぜ必要か,ゲームの構造にどの程度の人口が関係しているかを明らかにする。
論文参考訳（メタデータ） (2020-04-20T17:41:42Z)
Counterexamples to the Low-Degree Conjecture [80.3668228845075]
ホプキンスの予想は、ある高次元仮説テスト問題に対して、非時間アルゴリズムはいわゆる「単純な統計」よりも優れていると仮定する。この予想は、統計対計算のトレードオフを理解しようとする最近の研究のラインを囲む信念を定式化する。
論文参考訳（メタデータ） (2020-04-17T21:08:11Z)
On the complex behaviour of the density in composite quantum systems [62.997667081978825]
本研究では, 複合フェルミオン系における粒子の存在確率について検討した。非摂動特性であることが証明され、大/小結合定数双対性を見出す。 KAM定理の証明に触発されて、これらの小さな分母を排除したエネルギーのカットオフを導入することで、この問題に対処できる。
論文参考訳（メタデータ） (2020-04-14T21:41:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。