論文の概要: The Ringelmann Effect in Multi-Agent LLM Systems: A Scaling Law for Effective Team Size
- arxiv url: http://arxiv.org/abs/2606.02646v1
- Date: Sun, 31 May 2026 16:19:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.49028
- Title: The Ringelmann Effect in Multi-Agent LLM Systems: A Scaling Law for Effective Team Size
- Title(参考訳): マルチエージェントLLMシステムにおけるリングルマン効果:有効チームサイズのためのスケーリング法則
- Authors: Blaž Bertalanič, Carolina Fortuna,
- Abstract要約: 我々は,高密度ピアの影響がサブリニアからハードサイリングへと解答レベル体制を崩壊させることを示した。
30の高密度な議論剤はMMLU-Hardのそれ以上の答えの多様性をもたらす。
自由形式数学において、高密度なピアの影響は、解準線形からハードシーリングへの解準位体制を崩壊させる。
- 参考スコア(独自算出の注目度): 5.51170856062205
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inference-time multi-agent LLM scaling lacks a shared unit: counting nominal agents conflates cost with independent evidence. We derive a two-parameter scaling law $R(N) = N_\text{eff}/N = 1/(1+c(N-1)N^{-β})$ where the regime exponent $β$ classifies any configuration into one of three asymptotic regimes -- hard-ceiling at $1/c$ ($β= 0$), sublinear at $N^β/c$ ($0 < β< 1$), or linear ($β\ge 1$), and a mean-field theorem predicts that peer count $k$ and rounds $τ$ during agent debate enter the dynamics only through their product $kτ$. The law applies at two levels: answer diversity and correctness redundancy. Across 44 (model $\times$ task $\times$ condition) cells spanning peer debate, self-correction, random-noise placebo, self-consistency, three open-weight families (Qwen, Llama, Ministral) at scales from 7B to 32B with a frontier API check (Gemini), thinking models, heterogeneous teams, and sparse communication, the functional form fits every condition at $R^2 > 0.99$; only $(c, β)$ shifts. On free-form math, dense peer influence collapses the answer-level regime from sublinear into hard-ceiling; correctness-level fits remain hard-ceiling throughout. Three findings have practical implications. \emph{(i)}~Thirty dense debating agents produce no more answer diversity than one on MMLU-Hard. \emph{(ii)}~A noise placebo tracks self-correction on free-form math and at $4\times$ scale, so within homogeneous teams the gain commonly attributed to ``debate'' comes from re-evaluation, not peer content. \emph{(iii)}~A single $N \le 5$ pilot predicts the $N=30$ structural ceiling, and within the configurations tested only architectural diversity (heterogeneous teams) lowers $c$ and escapes the hard-ceiling regime, communication-mode interventions do not.
- Abstract(参考訳): 推論時マルチエージェント LLM スケーリングには共有単位が欠けている: 名目エージェントを数えると、コストは独立した証拠と混同される。
2パラメータスケーリング法$R(N) = N_\text{eff}/N = 1/(1+c(N-1)N^{-β})$ ここで、レジーム指数$β$は、任意の構成を3つの漸近的レジームのうちの1つに分類する。
この法は、多様性と正確さの2つのレベルに該当する。
Across 44 (model $\times$ task $\times$ condition) cell spaning peer debate, self-correction, random-noise placebo, self-consistency, three open-weight family (Qwen, Llama, Ministral) at scales to 7B to 32B with a frontier API check (Gemini), thinking model, heterogeneous team, and sparse communication, the functional form fits all condition at $R^2 > 0.99$; only $(c, β)$ shifts.
自由形式数学では、厳密なピア・インフルエンスにより、解答レベルがサブ線形からハード・シーリングへと崩壊する。
3つの発見は実際的な意味を持つ。
\emph{
(i)~3つの高密度議論剤はMMLU-Hardのそれ以上の答えの多様性を生じない。
\emph{
(ii)}~ノイズプラセボは、自由形式の数学と4\times$scaleの自己補正を追跡するため、同種チームでは、'debate'に代表される利得は、ピアコンテンツではなく再評価に由来する。
\emph{
(iii)}~ 単一の$N \le 5$パイロットが$N=30$の構造的天井を予測し、アーキテクチャの多様性(異種チーム)のみをテストした構成内では、$c$を下げて、ハードサイクルの体制から逃れるが、通信モードの介入は行わない。
関連論文リスト
- Exact equivariance, kept through training, buys zero-shot generalisation across the symmetry group [6.230579198456525]
等変エンコーダ$E$と等変予測器$f$から構築された潜在世界モデルは、トレーニング損失の証明可能な対称性を継承する。
このエンドツーエンドをラップトップスケール(CPU/MPS、完全シード)で検証する。
論文 参考訳(メタデータ) (2026-06-02T01:20:24Z) - Prism: Structural Symmetry Scanning via Duality-Constrained Laplacian Projection [0.0]
複雑なネットワークにおける構造対称性診断のためのフレームワークである textbfPrism を導入する。
Prismは、ネットワークが構造的自己整合性からどのくらい離れているかを測定するスカラーである。
論文 参考訳(メタデータ) (2026-05-18T04:20:05Z) - Wavelet Variance Equipartition as a Threshold for World-Model Quality and Quantum Kernel TN-Simulability [0.0]
我々はウェーブレットスケーリング指数$$を臨界診断として同定する。
振幅符号化された量子カーネルの古典的シミュラビリティのシャープな遷移境界として$=1/2$を確立する。
この分散は、厳密には$Var[X] = (d-2)$としてスケールする。
論文 参考訳(メタデータ) (2026-05-12T05:41:12Z) - Rényi exponent landscape of multipartite entanglement in free-fermion systems [51.56484100374058]
我々は、Rényi tripartite information $I_3() が小フェルミ運動量での質的に $exclusion-dependent scaling を示すことを示した。
I_m(n)/I_m(1) sim zm-1 to 0$ for all integer $n geq 2$, so the leading von Neumann signal can builded from integer Rényi data。
論文 参考訳(メタデータ) (2026-03-09T22:27:00Z) - INC: An Indirect Neural Corrector for Auto-Regressive Hybrid PDE Solvers [61.84396402100827]
本稿では,学習した補正を支配方程式に統合する間接ニューラルコレクタ(mathrmINC$)を提案する。
$mathrmINC$は、$t-1 + L$の順番でエラー増幅を減らし、$t$はタイムステップ、$L$はリプシッツ定数である。
大規模なベンチマークで$mathrmINC$をテストし、1Dカオスシステムから3D乱流まで、多くの異なる解法、神経バックボーン、テストケースをカバーした。
論文 参考訳(メタデータ) (2025-11-16T20:14:28Z) - Federated Combinatorial Multi-Agent Multi-Armed Bandits [79.1700188160944]
本稿では,Banditを用いたオンライン最適化に適したフェデレーション学習フレームワークを提案する。
この設定では、エージェントのアームサブセットは、個々のアーム情報にアクセスせずにこれらのサブセットに対するノイズの多い報酬を観察し、特定の間隔で協力して情報を共有することができる。
論文 参考訳(メタデータ) (2024-05-09T17:40:09Z) - Federated Linear Bandits with Finite Adversarial Actions [20.1041278044797]
我々は、M$のクライアントが中央サーバと通信し、線形文脈の帯域幅問題を解決するための連合線形帯域幅モデルについて検討する。
逆有限作用集合のユニークな問題に対処するため、FedSupLinUCBアルゴリズムを提案する。
我々は、FedSupLinUCBが$tildeO(sqrtd T)$の完全後悔を達成したことを証明している。
論文 参考訳(メタデータ) (2023-11-02T03:41:58Z) - Parameterized multipartite entanglement measures [2.4172837625375]
我々は、$n$-partite system, $q$-$k$-ME concurrence $(qgeq2,2leq kleq n)$と$alpha$-$k$-ME concurrence $(0leqalphaleqfrac12,2leq kleq n)$の2種類の絡み合い測度を示す。
厳密な証明は、提案された$k$非分離測度が絡み合い測度であるすべての要件を満たすことを示している。
論文 参考訳(メタデータ) (2023-08-31T01:58:47Z) - Quantum double aspects of surface code models [77.34726150561087]
基礎となる量子double $D(G)$対称性を持つ正方格子上でのフォールトトレラント量子コンピューティングの北エフモデルを再検討する。
有限次元ホップ代数$H$に基づいて、我々の構成がどのように$D(H)$モデルに一般化するかを示す。
論文 参考訳(メタデータ) (2021-06-25T17:03:38Z) - Fine-Grained Gap-Dependent Bounds for Tabular MDPs via Adaptive
Multi-Step Bootstrap [84.66885506098724]
本稿では,アダプティブ・マルチステップ・ブートストラップ (AMB) を用いた表層有限水平マルコフ決定過程 (MDP) のモデルフリーアルゴリズムを提案する。
AMBは,部分最適ギャップの逆の和でのみスケールする,ギャップ依存的後悔境界を達成できることを示す。
また、AMB は $frac|Z_mul|Delta_min$ regret という追加の $frac|Z_mul|Delta_min$ を被っていることも示しています。
論文 参考訳(メタデータ) (2021-02-09T07:46:34Z) - Variance-Aware Confidence Set: Variance-Dependent Bound for Linear
Bandits and Horizon-Free Bound for Linear Mixture MDP [76.94328400919836]
線形バンドイットと線形混合決定プロセス(mdp)に対する分散認識信頼セットの構築方法を示す。
線形バンドイットに対しては、$d を特徴次元とする$widetildeo(mathrmpoly(d)sqrt1 + sum_i=1ksigma_i2) が成り立つ。
線形混合 MDP に対し、$widetildeO(mathrmpoly(d)sqrtK)$ regret bound を得る。
論文 参考訳(メタデータ) (2021-01-29T18:57:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。