論文の概要: Hidden Anchors in Multi-Agent LLM Deliberation
- arxiv url: http://arxiv.org/abs/2606.19494v1
- Date: Wed, 17 Jun 2026 18:29:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.484748
- Title: Hidden Anchors in Multi-Agent LLM Deliberation
- Title(参考訳): マルチエージェントLCMにおける隠れアンカー
- Authors: Apurba Pokharel, Ram Dantu,
- Abstract要約: エージェントが複数のラウンドで回答を交換し、修正するマルチエージェントの議論は、推論と正確性を改善するためにますます利用されている。
このような議論は、人間の意思決定の仕方を反映している。
各エージェントが隠れた内部信念を持つ閉ループ力学系としてマルチエージェント検討をモデル化する。
- 参考スコア(独自算出の注目度): 1.2031796234206138
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent LLM deliberation, where agents exchange and revise answers over several rounds, is increasingly used to improve reasoning and accuracy, yet how and why it works is rarely modelled. Such deliberation mirrors how humans reach decisions. As social animals we are pulled both by the group, the herd effect that classical opinion-dynamics models such as DeGroot and Friedkin--Johnsen capture, and by our own internal belief, which they do not. We model multi-agent deliberation as a closed-loop dynamical system in which each agent carries a hidden internal belief, its anchor, that continually pulls its opinion regardless of its neighbours. We show this anchor can be recovered from the deliberation alone, and that it explains a behaviour classical consensus rules forbid: an agent's confidence in the correct answer can climb past where any agent started, escaping the space (convexhull) formed by the initial beliefs. Checking whether the recovered anchor also predicts held-out runs (generalizes) gives a simple test for when a model is truly driven bysuch an anchor. Across three open-weight model families this is a spectrum, not all-or-nothing. All anchors' influence are about equally strongly, but they differ in where the anchor sits, and only when it sits far from the initial opinions does deliberation escape the hull and need the full closed-loop model.
- Abstract(参考訳): エージェントが複数のラウンドで回答を交換し、修正するマルチエージェントLLM検討は、推論と正確性を改善するためにますます使われているが、どのように、なぜそれが機能するかは、ほとんどモデル化されない。
このような議論は、人間の意思決定の仕方を反映している。
社会的な動物として私たちは、DeGrootやFriedkin-Johnsenのような古典的な世論力学モデルが捉えている群れと、そうでない内的信念の両方によって引き寄せられている。
我々は,マルチエージェントの議論を閉ループ力学系としてモデル化し,各エージェントが隠れた内部信念,アンカーを担い、隣人に関係なく常に意見を引き出す。
エージェントの正しい回答に対する自信は、エージェントが開始した場所を通り過ぎ、初期信念によって形成された空間(convexhull)から逃れることができる。
復元されたアンカーがホールドアウト実行(一般化)を予測しているかどうかをチェックすることで、モデルが実際にアンカーによって駆動されている場合の簡単なテストが可能になる。
オープンウェイトモデルファミリの3つにまたがって、これはスペクトルであり、すべてあるいは何も持たない。
すべてのアンカーの影響は等しく強いが、アンカーがどこにあるかは異なり、最初の意見から遠く離れているときのみ船体から脱出し、完全なクローズドループモデルを必要とする。
関連論文リスト
- Adversarial Feeds Steer LLM Agent Decisions Against Their Defaults [0.0]
LLMエージェントは、ソーシャルフィード、検索結果、検索コンテキスト、電子メールキューなどのランク付けされた外部情報ストリームを消費した後、ますます行動する。
モデル,ペルソナ,トピック,最終決定のプロンプトを保持する制御プロトコルを導入し,エージェントが遭遇するポストの構成と順序だけを変化させる。
我々は, 逆降圧, デフォルト飽和, 一方のフィードが真に不確実な決定を下す非対称性の3つの応答機構を同定した。
論文 参考訳(メタデータ) (2026-05-30T22:43:23Z) - The Bystander Effect in Multi-Agent Reasoning: Quantifying Cognitive Loafing in Collaborative Interactions [6.357772907811544]
我々は3つのデータセットコンテキストにまたがる22,500の決定論的軌跡を,3つの最先端(SOTA)モデルで評価した。
我々はtextitSovereignty Gap を形式化する:モデルはしばしば正しい導出を内部で計算するが、アライメント幻覚に苦しむ」。
我々は,マルチエージェントの社会的負荷が厳密に非可換であることを証明し,リード・アンカーの監査役の「ブランド」アイデンティティは群集の整合性を不当に判断する。
論文 参考訳(メタデータ) (2026-05-11T15:13:01Z) - Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - Consensus Is All You Need: Gossip-Based Reasoning Among Large Language Models [0.0]
ひとつのモデルのみに頼るのではなく、分散システムのゴシッププロトコルからインスピレーションを得ます。
この"ゴシップベースのコンセンサス"が、堅牢で回復力があり、正確なマルチエージェントAI推論につながることが示されています。
論文 参考訳(メタデータ) (2025-08-22T05:49:27Z) - Judging with Many Minds: Do More Perspectives Mean Less Prejudice? On Bias Amplifications and Resistance in Multi-Agent Based LLM-as-Judge [70.89799989428367]
我々は、位置バイアス、冗長性バイアス、チェーンオブ思考バイアス、バンドワゴンバイアスの4つの多様なバイアスタイプを体系的に分析する。
広く採用されているマルチエージェントLLM-as-JudgeフレームワークであるMulti-Agent-DebateとLLM-as-Meta-Judgeでこれらのバイアスを評価する。
論文 参考訳(メタデータ) (2025-05-26T03:56:41Z) - Rethinking LLM Uncertainty: A Multi-Agent Approach to Estimating Black-Box Model Uncertainty [47.95943057892318]
ブラックボックスLSMの不確実性の定量化は、信頼性の高い応答とスケーラブルな監視に不可欠である。
本研究では,不確実性推定にマルチエージェント相互作用を用いた新しい理論的基礎手法であるDiverseAgentEntropyを紹介する。
論文 参考訳(メタデータ) (2024-12-12T18:52:40Z) - Bandit Social Learning: Exploration under Myopic Behavior [54.767961587919075]
オンラインプラットフォーム上でのレビューによって動機付けられた社会学習のダイナミクスについて検討する。
エージェントはまとめて単純なマルチアームのバンディットプロトコルに従うが、各エージェントは探索を伴わずにミオプティカルに振る舞う。
このような振る舞いに対して,スターク学習の失敗を導出し,好意的な結果を提供する。
論文 参考訳(メタデータ) (2023-02-15T01:57:57Z) - Agent-Based Simulation of Collective Cooperation: From Experiment to
Model [0.0]
我々は,人が密集した静的な群集を通り抜けたときに何が起こるのかを観察する実験を行う。
我々は,協力を必要とする状況に対するエージェントの認識と認知処理を取り入れたモデルを構築した。
エージェントが密集した群衆をうまく通過する能力は、心理的モデルの効果として現れる。
論文 参考訳(メタデータ) (2020-05-26T13:29:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。