論文の概要: Attributing Emergence in Million-Agent Systems
- arxiv url: http://arxiv.org/abs/2605.11404v1
- Date: Tue, 12 May 2026 01:49:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.518735
- Title: Attributing Emergence in Million-Agent Systems
- Title(参考訳): 数百万のエージェントシステムにおける創発
- Authors: Ling Tang, Jilin Mei, Qian Chen, Qihan Ren, Linfeng Zhang, Quanshi Zhang, Jing Shao, Xia Hu, Dongrui Liu,
- Abstract要約: 大規模言語モデル(LLM)は、個々のエージェントにおける人間のような推論と意思決定をシミュレートすることができる。
このような研究は、個々のエージェントにマクロな出現をもたらす必要がある。
Aumann--Shapley path-integral attribution to LLM-powered MAS at million-agent scale。
- 参考スコア(独自算出の注目度): 68.53670424791751
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) can simulate human-like reasoning and decision-making in individual agents. LLM-powered multi-agent systems (MAS) combine such agents to simulate population-scale social phenomena such as polarization, information cascades, and market panics. Such studies require attributing macro emergence to individual agents, but existing axiomatic methods scale combinatorially in $N$ and have been confined to $N \lesssim 10^3$, while the phenomena they explain occur at $N \geq 10^6$. We address this gap by adapting Aumann--Shapley path-integral attribution to LLM-powered MAS at million-agent scale; the resulting method satisfies all four axioms, runs four to five orders of magnitude faster than sampled Shapley on the same hardware. We use this method to test the scale gap empirically: across 14 days of public Bluesky data ($1{,}671{,}587$ active users), we compute the attribution at both full scale and the visibility-biased $N = 10^2$ convenience sample used by small-scale studies, and the two disagree structurally. At full scale the long tail and middle tier jointly carry the majority; the biased small panel attributes almost everything to a few high-follower accounts. We then prove that under any nonlinear macro indicator the disagreement cannot be reduced by post-hoc rescaling: an Attribution Scaling Bias theorem shows that no global rescaling factor can reconcile small-scale and full-scale attribution. Full-scale attribution is therefore not a methodological choice but a theoretical requirement for any nonlinear macro indicator.
- Abstract(参考訳): 大規模言語モデル(LLM)は、個々のエージェントにおける人間のような推論と意思決定をシミュレートすることができる。
LLMを利用したマルチエージェントシステム(MAS)は、こうしたエージェントを組み合わせて、偏光、情報カスケード、市場パニックといった人口規模の社会現象をシミュレートする。
このような研究は個々のエージェントにマクロな出現をもたらすが、既存の公理的手法は結合的に$N$にスケールし、説明される現象は$N \geq 10^6$に制限されている。
我々は,Aumann-Shapleyパス積分属性をLLM駆動のMASに100万単位のスケールで適用することにより,このギャップに対処する。
この方法を用いて,14日間にわたるパブリックBlueskyデータ(1{,}671{,}587$アクティブユーザ)のスケールギャップを実証的に検証する。
フルスケールでは、長い尾と中間層が共同で多数を担い、バイアスのかかった小さなパネルは、ほとんど全てを少数の高低のアカウントに当てはめている。
帰属スケーリングバイアス定理(Attribution Scaling Bias theorem)は、大域的再スケーリング因子が小規模およびフルスケールの帰属を調整できないことを示している。
したがって、フルスケールの帰属は方法論的な選択ではなく、非線形マクロ指標の理論的な要求である。
関連論文リスト
- Collective Alignment in LLM Multi-Agent Systems: Disentangling Bias from Cooperation via Statistical Physics [0.0]
そこで,本研究では,本態性バイアスから社会的整合性を解き,臨界指数を計算し,マルチエージェントシステムの集合的挙動と相転移を探索するモデルに依存しない統計的物理法を提案する。
集合的アライメントは、協調的な隣り合う結合よりも本質的なバイアスによって支配され、真の相転移の代わりに場駆動のクロスオーバーを生成する。
論文 参考訳(メタデータ) (2026-05-11T13:13:44Z) - Descent-Guided Policy Gradient for Scalable Cooperative Multi-Agent Learning [14.185814237633958]
Descent-Guided Policy Gradient (DG-PG) は、ノイズフリーなエージェントごとのガイダンス勾配を構築するフレームワークである。
DG-PGは、勾配分散を$(N)$から$mathcalO(1)$に減らし、協調ゲームの平衡を保ち、エージェント非依存のサンプル複雑性を実現する。
論文 参考訳(メタデータ) (2026-02-23T17:45:08Z) - Mean-Field Reinforcement Learning without Synchrony [11.907264672363718]
平均場強化学習は、各エージェントの他者への依存を1つの要約統計量(平均行動)に減らし、大集団にスケールする。
既存のMF-RL理論は平均作用に基づいて構築され、$に拡張されない。
人口分布のスクラッチから$$$のテンポラル平均場(Temporal Mean Field)フレームワークを構築し,全同期から純粋にシーケンシャルな意思決定までの全スペクトルを網羅した。
論文 参考訳(メタデータ) (2026-02-20T06:42:08Z) - Large Language Models Are Bad Dice Players: LLMs Struggle to Generate Random Numbers from Statistical Distributions [50.1404916337174]
大規模言語モデル(LLM)における母国語の確率的サンプリングの大規模,統計的に活用された最初の監査について述べる。
バッチ生成は, ほぼ完全に崩壊する一方, 中央値のパスレートが13%であり, 統計的妥当性はわずかであることがわかった。
現在のLCMには機能的な内部サンプルが欠如しており、統計的保証を必要とするアプリケーションに外部ツールを使う必要があると結論付けている。
論文 参考訳(メタデータ) (2026-01-08T22:33:12Z) - Minimax-Optimal Multi-Agent Robust Reinforcement Learning [7.237817437521988]
我々は、生成モデルへのアクセスを前提として、Q-FTRLアルゴリズム citepli2022minimax を有限水平設定で RMG に拡張する。
提案アルゴリズムは$varepsilon$-robust coarse correlation equilibrium (CCE) を$widetildeOleft(H3Ssum_i=1mA_iminleftH,1/Rright/varepsilon2right) のサンプル複雑性(ログファクタまで)で達成している。
論文 参考訳(メタデータ) (2024-12-27T16:37:33Z) - Model-Based Multi-Agent RL in Zero-Sum Markov Games with Near-Optimal
Sample Complexity [67.02490430380415]
モデルに基づくMARLは、Nash平衡値(NE)を求めるために$tilde O(|S||B|(gamma)-3epsilon-2)$のサンプル複雑性を実現する。
また、アルゴリズムが報酬に依存しない場合、そのようなサンプル境界は最小値(対数因子まで)であり、アルゴリズムは報酬知識のない遷移サンプルを問合せする。
論文 参考訳(メタデータ) (2020-07-15T03:25:24Z) - Breaking the Sample Size Barrier in Model-Based Reinforcement Learning
with a Generative Model [50.38446482252857]
本稿では、生成モデル(シミュレータ)へのアクセスを想定して、強化学習のサンプル効率について検討する。
最初に$gamma$-discounted infinite-horizon Markov decision process (MDPs) with state space $mathcalS$ and action space $mathcalA$を考える。
対象の精度を考慮すれば,モデルに基づく計画アルゴリズムが最小限のサンプルの複雑さを実現するのに十分であることを示す。
論文 参考訳(メタデータ) (2020-05-26T17:53:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。