論文の概要: When Is Emergent Consensus Real? A Measured Coupling Gain and a Validity Diagnostic for LLM Agent Societies
- arxiv url: http://arxiv.org/abs/2606.22203v1
- Date: Sat, 20 Jun 2026 19:41:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 22:03:33.972901
- Title: When Is Emergent Consensus Real? A Measured Coupling Gain and a Validity Diagnostic for LLM Agent Societies
- Title(参考訳): 創発的合意はいつ実現されるか? : LLMエージェント・ソサイエティのカップリング利得と妥当性診断
- Authors: Dongxu Yang,
- Abstract要約: LLM「エージェント・ソサエティ」は、創発的なコンセンサスや偏光の実証を通じて研究される。
結果が真の社会的ダイナミクスなのか、あるいはモデルアーティファクトなのかは、テストされていない。
隣人の意見に逆らうことによって, 年齢ごとのカップリングゲイン+, 測定値について紹介する。
- 参考スコア(独自算出の注目度): 1.2763567932588586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LLM "agent societies" are studied via demonstrations of emergent consensus or polarization -- with no measurable control parameter, no theory of when each regime appears, and no test of whether an outcome is a genuine social dynamic or a model artifact. We introduce the coupling gain gamma, measured per-agent by counterfactually perturbing a neighbour's stated opinion. (i) gamma is stable and model-distinguishing -- across five frontier models it spans 0.15-0.43 (n=20, 95% CIs <= 0.025), paraphrase-invariant; social-neighbour gamma roughly equals numeric-anchor gamma, so gamma is evidence-coupling, not uniquely social. (ii) Classical dynamics with measured (not assumed) coefficients organise the regime: Friedkin-Johnsen for consensus/pluralism, signed-Laplacian/structural-balance for polarization. (iii) Frontier LLMs do not spontaneously backfire (beta <= 0), so default societies do not self-polarize -- polarization is always induced; the beta>0 branch arises only in the FJ surrogate, never in the agents. (iv) A randomized-initial-condition diagnostic -- the (slope, bias) of final vs. initial opinion -- separates genuine averaging from model-prior artifacts (boundary-censoring ruled out by construction via interior-valued facts); applied to a published "emergent consensus" result (Chuang et al. 2023) it reveals a model-specific conflation: averaging on debatable claims, prior-artifact on settled facts. (v) Coupling is context-dependent: pairwise gamma does not predict multi-neighbour outcomes -- it can order them backwards -- whereas a modality-matched group coupling does (sixteen closed+open models, Pearson r=-0.70, permutation p=0.008). The regime laws take this matched coupling, not the single-neighbour gamma: emergent consensus must be read from coupling in the target interaction. We contribute a measurement protocol and a validity instrument, not new theory.
- Abstract(参考訳): LLMの「エージェント・ソサエティ」は、創発的なコンセンサスや偏光のデモンストレーションを通じて研究され、測定可能な制御パラメータ、各レジームの出現時期の理論、結果が真の社会的ダイナミクスかモデルアーティファクトかの検証はない。
本稿では,隣人の意見に反する摂動によって測定される結合利得ガンマについて紹介する。
(i)ガンマは安定でモデルの不連続であり、フロンティアモデルでは0.15-0.43(n=20, 95% CIs <= 0.025)、パラフレーズ不変である。
(II) コンセンサス/多元主義のフリードキン・ジョンセン(Friedkin-Johnsen)、分極のサイン・ラプラシアン/構造バランス(Stand-Laplacian/Struformural- Balance)。
3)フロンティアLSMは自然にバックファイア(β<=0)を起こさないため,デフォルト社会は自己分極を起こさない。
(四 最終意見と初期意見の無作為な初期条件診断 --(傾斜、偏り)は、モデル優先の成果物(内的価値のある事実によって構築によって除外された有界検閲)から真の平均値を切り離す。)を分離し、公表された「創発的コンセンサス」結果(Chuang et al 2023)に適用することにより、不当なクレームに基づく平均値、解決された事実に関する先行アーティファクトを明らかにする。
(v) カップリングは文脈に依存している: ペアワイズガンマは多重近傍の結果を予測しない -- 後方に順序付けできる -- に対して、モダリティ整合群結合は(6つの閉開モデル、ピアソン r=-0.70、置換 p=0.008) である。
政権法則はこの結合を単近傍ガンマではなく、一致した結合とみなす:創発的コンセンサスは、対象の相互作用における結合から読み取らなければならない。
我々は,新しい理論ではなく,測定プロトコルと妥当性機器に貢献する。
関連論文リスト
- Measuring the Symmetry--Data Exchange Rate [0.2538209532048867]
同一の軌道サイズと一致した計算値を持つ間違った群制御は制約を伴わないよりも悪いことを示す。
相対交換率beta_diff = 1.28は、理論ブートストラップ1.0と符号と桁違いに一致している。
手法的貢献 -- 共有拡散の欠点をキャンセルする相対レート推定器、間違ったグループ制御、および予め特定された失敗分類 - は、強度をパラメータ化できる帰納バイアスに転送される。
論文 参考訳(メタデータ) (2026-05-31T08:17:40Z) - The Matching Principle: A Geometric Theory of Loss Functions for Nuisance-Robust Representation Learning [0.5854803320592717]
線形ガウスモデル (Thm.A) における最適性を証明し, 展開のドリフトをゼロにする2次ペナルティに対する範囲被覆の必要性 (Thm.G) を示す。
13ブロック(MLからQwen2.5-7Bまで)のテストは、幾何と展開のドリフトに対する等方性対間違った方向の罰則と一致した。
Sigma_taskを推定し、Sigmaにマッチし、コントロールを実行し、タスクとジオメトリを別々にレポートする。
論文 参考訳(メタデータ) (2026-05-21T17:53:28Z) - The Attribution Impossibility: No Feature Ranking Is Faithful, Stable, and Complete Under Collinearity [0.0]
機能がコリニアである場合には,機能ランキングを忠実に,安定的に,かつ完全なものにすることはできない。
この不合理性を証明し、4つのモデルクラスを定量化し、アンサンブル平均化(DASH)によってそれを解決し、305のLean 4定理でそれをマシン検証する。
設計空間の定理、診断、そして不合理性はLean 4(16の公理から305の定理、残念なことに0の定理)で機械的に検証されます。
論文 参考訳(メタデータ) (2026-04-08T10:11:45Z) - Information Fidelity in Tool-Using LLM Agents: A Martingale Analysis of the Model Context Protocol [69.11739400975445]
モデルコンテキストプロトコル(MCP)エージェントにおけるエラー蓄積を解析するための最初の理論的枠組みを紹介する。
累積歪みが線形成長と高確率偏差を$O(sqrtT)$で表すことを示す。
主な発見は、意味重み付けは歪みを80%減らし、周期的再接地は、エラー制御の約9ステップごとに十分である。
論文 参考訳(メタデータ) (2026-02-10T21:08:53Z) - Thompson sampling: Precise arm-pull dynamics and adaptive inference [0.7614628596146601]
我々は、トンプソン型アルゴリズムの別の標準クラスにおける正確なアームプルダイナミクスについて研究する。
アームパール数が決定論的であることと、アームが最適以下であるか、あるいは一意の最適アームである場合に限り、アームパール数は決定論的であることを示す。
正常化された腕は、安定な腕の制限と不安定な腕の半普遍的非ガウス的制限により、同じ二分法に従うことを意味する。
論文 参考訳(メタデータ) (2026-01-29T00:12:04Z) - Detecting Unobserved Confounders: A Kernelized Regression Approach [46.52607207396279]
Kernel Regression Confounder Detection (KRCD) は、単一環境下での非線形観測データにおける観測不能なコンバウンディングを検出する新しい方法である。
ゼロからの有意な偏差が観測不能な共起を示すテスト統計学。
合成ベンチマークとツインズデータセットの実験は、KRCDが既存のベースラインを上回るだけでなく、計算効率も優れていることを示した。
論文 参考訳(メタデータ) (2026-01-01T04:26:02Z) - Unregularized Linear Convergence in Zero-Sum Game from Preference Feedback [50.89125374999765]
NLHFにおける最適乗算重み更新(mathtOMWU$)に対する最初の収束保証を提供する。
本分析では, 稀に発生する行動の確率が指数関数的に小さい値から指数関数的に増大する新たな限界収束挙動を同定する。
論文 参考訳(メタデータ) (2025-12-31T12:08:29Z) - Fundamental limits to contrast reversal of self-fidelity correlations [0.0]
測定設計においては、アンチコントラストのリードアウトを設計することが一般的である。
広義の入力アンサンブルに対して2つの進化を均一に反対にできるかどうかを問う。
我々は、ピアソン相関係数を、2つの進化の間の大域的対立のデバイスに依存しない尺度として採用する。
論文 参考訳(メタデータ) (2025-09-30T15:07:28Z) - TIC-TAC: A Framework for Improved Covariance Estimation in Deep Heteroscedastic Regression [109.69084997173196]
奥行き回帰は、予測分布の平均と共分散を負の対数類似度を用いて共同最適化する。
近年の研究では, 共分散推定に伴う課題により, 準最適収束が生じる可能性が示唆されている。
1)予測共分散は予測平均のランダム性を真に捉えているか?
その結果, TICは共分散を正確に学習するだけでなく, 負の対数類似性の収束性の向上も促進することがわかった。
論文 参考訳(メタデータ) (2023-10-29T09:54:03Z) - Near-Optimal Non-Parametric Sequential Tests and Confidence Sequences
with Possibly Dependent Observations [44.71254888821376]
我々は、一般的な非データ生成プロセスの下で、最初のタイプIエラーと予測リジェクション時間保証を提供する。
本研究では, 平均処理効果など, 方程式を推定することによって定義されるパラメータの推測に, 結果を適用する方法を示す。
論文 参考訳(メタデータ) (2022-12-29T18:37:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。