論文の概要: Too Polite to Disagree: Understanding Sycophancy Propagation in Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2604.02668v1
- Date: Fri, 03 Apr 2026 03:02:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.294715
- Title: Too Polite to Disagree: Understanding Sycophancy Propagation in Multi-Agent Systems
- Title(参考訳): 診断するにはポーライトが多すぎる:マルチエージェントシステムにおける語彙の伝播を理解する
- Authors: Vira Kasprova, Amruta Parulekar, Abdulrahman AlRabah, Krishna Agaram, Ritwik Garg, Sagar Jha, Nimet Beyza Bozdag, Dilek Hakkani-Tur,
- Abstract要約: 大規模言語モデル(LLM)は、しばしば梅毒性を示す。
我々は、それぞれが梅毒に対する傾向を推定するピア・サイコファンシー・ランキングをエージェントに提供する。
その結果, サイコファンシーの先行性の提供は, サイコファンシー・ピアの影響を低減し, エラーカスケードを緩和し, 最終的な議論精度を10.5%向上させることがわかった。
- 参考スコア(独自算出の注目度): 3.2961356090661393
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large language models (LLMs) often exhibit sycophancy: agreement with user stance even when it conflicts with the model's opinion. While prior work has mostly studied this in single-agent settings, it remains underexplored in collaborative multi-agent systems. We ask whether awareness of other agents' sycophancy levels influences discussion outcomes. To investigate this, we run controlled experiments with six open-source LLMs, providing agents with peer sycophancy rankings that estimate each peer's tendency toward sycophancy. These rankings are based on scores calculated using various static (pre-discussion) and dynamic (online) strategies. We find that providing sycophancy priors reduces the influence of sycophancy-prone peers, mitigates error-cascades, and improves final discussion accuracy by an absolute 10.5%. Thus, this is a lightweight, effective way to reduce discussion sycophancy and improve downstream accuracy.
- Abstract(参考訳): 大規模言語モデル(LLM)は、しばしば梅毒性を示す。
以前の研究は主に単一エージェント環境で研究されてきたが、協調マルチエージェントシステムでは未検討のままである。
他エージェントの薬効レベルに対する意識が議論の結果に影響を及ぼすかどうかを問う。
そこで我々は,6つのオープンソースLCMを用いて制御実験を行い,それぞれが梅毒に対する傾向を推定するピア・サイコファンシー・ランキングをエージェントに提供した。
これらのランキングは、様々な静的(事前判断)と動的(オンライン)戦略を用いて計算されたスコアに基づいている。
我々は, サイコフィナンシーの先行性を提供することで, サイコフィナンシーが引き起こすピアの影響を低減し, エラーカスケードを緩和し, 最終的な議論精度を10.5%向上することを発見した。
したがって、これは議論のサイコフィナンシーを減らし、下流の精度を向上させるための軽量で効果的な方法である。
関連論文リスト
- Ask don't tell: Reducing sycophancy in large language models [1.5701458173528275]
本研究は, 質問に対する非質問に対する回答において, 薬効が有意に高いことを示す。
疑問に答える前に、モデルに非疑問を質問に変換するよう求めると、薬効が著しく低下することがわかった。
論文 参考訳(メタデータ) (2026-02-27T12:27:04Z) - Agentic Test-Time Scaling for WebAgents [65.5178428849495]
CATTS(Confidence-Aware Test-Time Scaling)を提案する。
CATTSは、WebArena-LiteとGoBrowseのパフォーマンスをReact上で最大9.1%改善し、均一なスケーリングよりも最大2.3倍少ないトークンを使用する。
論文 参考訳(メタデータ) (2026-02-12T18:58:30Z) - Peacemaker or Troublemaker: How Sycophancy Shapes Multi-Agent Debate [30.66779902590191]
大規模言語モデル (LLM) はしばしば、過剰な一致性を示す傾向がある。
LLMs固有の薬理は、議論を早めの合意に崩壊させる可能性がある。
論文 参考訳(メタデータ) (2025-09-27T02:27:13Z) - STARec: An Efficient Agent Framework for Recommender Systems via Autonomous Deliberate Reasoning [54.28691219536054]
我々は、自律的な熟考的推論機能を備えたレコメンデータシステムを支援する、ゆっくり考えられた拡張エージェントフレームワークSTARecを紹介する。
我々は,先進的推論モデルと嗜好整合型報酬形成から構造化知識の蒸留を組み合わせた2段階のパラダイムであるアンカー強化訓練を開発する。
MovieLens 1MとAmazon CDsベンチマークの実験では、STARecは最先端のベースラインと比較して、大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-08-26T08:47:58Z) - BASIL: Bayesian Assessment of Sycophancy in LLMs [26.346357679861228]
Sycophancyは、人間とAIのコラボレーションの文脈で理解するために重要である。
既存のLLMにおけるサイコファンシーの研究方法は、記述的(サイコファンシーが誘発されたときの学習行動の変化)または規範的である。
LLMの合理性に対する梅毒の規範的影響を研究するためのベイズ的枠組みを導入する。
論文 参考訳(メタデータ) (2025-08-23T00:11:00Z) - Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。
現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。
情報共有の適度なレベルでさえ、環境固有のエラーを著しく軽減することを示す。
論文 参考訳(メタデータ) (2025-03-21T18:06:28Z) - Have the VLMs Lost Confidence? A Study of Sycophancy in VLMs [44.56018149475948]
梅毒症は視覚言語モデル(VLM)に重大な課題をもたらす幻覚である
そこで我々は,シコファンシーを緩和するために,プロンプト,教師付き微調整,DPOに基づく訓練と手法を用いた合成データセットを提案する。
以上の結果から, モデル上層部では, 梅毒予防能力が顕著であることが明らかとなった。
論文 参考訳(メタデータ) (2024-10-15T05:48:14Z) - Sycophancy in Vision-Language Models: A Systematic Analysis and an Inference-Time Mitigation Framework [18.54098084470481]
本稿では,視覚言語ベンチマーク間のサイコフィナンシーを分析し,推論時間緩和フレームワークを提案する。
我々のフレームワークは、中立なプロンプトの性能を維持しながら、評価されたすべてのモデルでサイコフィナンシーを効果的に軽減します。
論文 参考訳(メタデータ) (2024-08-21T01:03:21Z) - Simple synthetic data reduces sycophancy in large language models [88.4435858554904]
言語モデルにおける梅毒の有病率について検討する。
サイコファシー(Sycophancy)とは、モデルがそのビューが客観的に正しくない場合でも、人間のユーザのビューに従うように、応答を調整する場所である。
論文 参考訳(メタデータ) (2023-08-07T23:48:36Z) - Accelerated Convergence for Counterfactual Learning to Rank [65.63997193915257]
IPS重み付き勾配を持つSGD手法の収束速度は、IPS重みによる大きなばらつきに悩まされることを示す。
本稿では,従来のIPS重み付け勾配降下法よりも優れた収束性を有する新しい学習アルゴリズムであるCounterSampleを提案する。
我々は、CounterSampleがより早く収束し、理論的な結果と経験的な結果とを補完することを証明する。
論文 参考訳(メタデータ) (2020-05-21T12:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。