論文の概要: The Bystander Effect in Multi-Agent Reasoning: Quantifying Cognitive Loafing in Collaborative Interactions
- arxiv url: http://arxiv.org/abs/2605.10698v1
- Date: Mon, 11 May 2026 15:13:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.927032
- Title: The Bystander Effect in Multi-Agent Reasoning: Quantifying Cognitive Loafing in Collaborative Interactions
- Title(参考訳): マルチエージェント推論における傍観者効果:協調的相互作用における認知的障害の定量化
- Authors: Dahlia Shehata, Ming Li,
- Abstract要約: 我々は3つのデータセットコンテキストにまたがる22,500の決定論的軌跡を,3つの最先端(SOTA)モデルで評価した。
我々はtextitSovereignty Gap を形式化する:モデルはしばしば正しい導出を内部で計算するが、アライメント幻覚に苦しむ」。
我々は,マルチエージェントの社会的負荷が厳密に非可換であることを証明し,リード・アンカーの監査役の「ブランド」アイデンティティは群集の整合性を不当に判断する。
- 参考スコア(独自算出の注目度): 6.357772907811544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent systems (MAS) assume that collaborating inherently improves Large Language Model (LLM) reasoning. We challenge this by demonstrating that simulated social pressure triggers an algorithmic ``Bystander Effect,'' inducing severe cognitive loafing. By evaluating 22,500 deterministic trajectories across 3 dataset contexts (GAIA, SWE-bench, Multi-Challenge) with 3 state-of-the-art (SOTA) models, we semantically audit internal reasoning traces against external outputs. We formalize the \textit{Interaction Depth Limit} ($D_L$), the exact plurality threshold where an agent's logical sovereignty collapses into social compliance. Crucially, we uncover the \textit{Sovereignty Gap}: models frequently compute the correct derivation internally but suffer ``Alignment Hallucinations'' -- actively subjugating empirical evidence to sycophantically appease a simulated swarm. We prove that multi-agent social load is strictly non-commutative; the "brand" identity of the ``Lead Anchor'' auditor disproportionately dictates the swarm's integrity. These findings expose architectural vulnerabilities, proving that unstructured multi-agent topologies can degrade independent reasoning.
- Abstract(参考訳): マルチエージェントシステム(MAS)は、協調が本質的にLarge Language Model(LLM)推論を改善すると仮定する。
シミュレーションされた社会的圧力が「バイスタンダー・エフェクト」のアルゴリズムを誘発し、重度の認知障害を引き起こすことを示すことで、この問題に挑戦する。
3つのデータセットコンテキスト(GAIA, SWE-bench, Multi-Challenge)の22,500の決定論的軌跡を3つの最先端(SOTA)モデルで評価することにより、外部出力に対する内部推論トレースを意味的に監査する。
エージェントの論理的主権が社会的コンプライアンスに崩壊する正確な複数のしきい値である「textit{Interaction Depth Limit}」(D_L$)を定式化する。
重要な事柄として、'textit{Sovereignty Gap}:モデルは内部で正しい導出を頻繁に計算するが、'alignment Hallucinations' に苦しむ。
我々は,マルチエージェントの社会的負荷が厳密に非可換であることを証明する。
これらの発見は、非構造的マルチエージェントトポロジが独立した推論を分解できることを証明し、アーキテクチャ上の脆弱性を明らかにした。
関連論文リスト
- The Inverse-Wisdom Law: Architectural Tribalism and the Consensus Paradox in Agentic Swarms [6.357772907811544]
コンセンサス・パラドックス(Consensus Paradox)とは、エージェント群が外部論理的真理よりも内部アーキテクチャ上の合意を優先する現象である。
逆ウィズダム法則(英語版)を証明する: 親族支配のスワムにおいて、論理的エージェントを追加することにより、真理の確率よりも誤った軌道の安定性が増大する。
また、変圧器重みの力学則として、建築部族主義の非対称性を確立する。
論文 参考訳(メタデータ) (2026-04-30T00:06:21Z) - Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - Mechanistic Decoding of Cognitive Constructs in Large Language Models [0.0]
本稿では,表現工学に基づく認知的リバースエンジニアリングフレームワークを提案する。
評価理論を部分空間化、回帰に基づく重み付け、双方向因果操りと組み合わせることで、2つの心理学的先駆者(妬み)を分離・定量化する。
また, 有害な情動状態が機械的に検出され, 外科的に抑制される可能性を示し, マルチエージェント環境におけるAIの安全性に対する表現的モニタリングと介入への道のりが示唆された。
論文 参考訳(メタデータ) (2026-04-16T03:54:03Z) - Anatomy of a Lie: A Multi-Stage Diagnostic Framework for Tracing Hallucinations in Vision-Language Models [62.932580559941414]
VLM(Vision-Language Models)は、しばしば「ハロシン化(hallucinate)」する。
本稿では,静的な出力誤差からモデル計算認知の動的病理へ再キャストし,幻覚を診断するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2026-03-16T17:20:38Z) - OMG-Agent: Toward Robust Missing Modality Generation with Decoupled Coarse-to-Fine Agentic Workflows [9.617220633655716]
textbfunderlineOmni-textbfunderlineModality textbfunderlineGeneration Agent (textbfOMG-Agent)について述べる。
論文 参考訳(メタデータ) (2026-02-04T02:25:40Z) - CoG: Controllable Graph Reasoning via Relational Blueprints and Failure-Aware Refinement over Knowledge Graphs [53.199517625701475]
CoGはDual-Process Theoryにインスパイアされたトレーニング不要のフレームワークで、直観と熟考の相互作用を模倣している。
CoGは精度と効率の両方において最先端のアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2026-01-16T07:27:40Z) - Hallucination Detection via Internal States and Structured Reasoning Consistency in Large Language Models [7.18947815679122]
内部状態探索と整合検証は、大きな言語モデルにおける幻覚を検出するために用いられる。
両手法のギャップを埋める統一的なフレームワークを開発する。
私たちのフレームワークは一貫して、強力なベースラインをはるかに上回ります。
論文 参考訳(メタデータ) (2025-10-13T15:31:21Z) - Sim-to-Real Causal Transfer: A Metric Learning Approach to Causally-Aware Interaction Representations [58.96953392466609]
エージェント相互作用の現代的表現の因果認識を詳細に検討する。
近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。
本稿では,因果アノテーションを用いて潜在表現を規則化するメトリクス学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-07T18:57:03Z) - Neural Amortized Inference for Nested Multi-agent Reasoning [54.39127942041582]
本研究では,人間のような推論能力と計算限界のギャップを埋める新しい手法を提案する。
提案手法を2つの挑戦的マルチエージェント相互作用領域で評価する。
論文 参考訳(メタデータ) (2023-08-21T22:40:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。