論文の概要: Hear Both Sides: Efficient Multi-Agent Debate via Diversity-Aware Message Retention
- arxiv url: http://arxiv.org/abs/2603.20640v1
- Date: Sat, 21 Mar 2026 04:27:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.010766
- Title: Hear Both Sides: Efficient Multi-Agent Debate via Diversity-Aware Message Retention
- Title(参考訳): 両面聴取:多様性を意識したメッセージ保持による効率的なマルチエージェント討論
- Authors: Manh Nguyen, Anh Nguyen, Dung Nguyen, Svetha Venkatesh, Hung Le,
- Abstract要約: Multi-Agent Debateは、大規模言語モデルの推論品質を改善するための有望なフレームワークとして登場した。
現在のアプローチは、放送前の低信頼応答をフィルタする不確実性推定に依存している。
本稿では,エージェント応答のサブセットを選択する軽量な討論フレームワークであるDiversity-Aware Retention (DAR)を提案する。
- 参考スコア(独自算出の注目度): 31.583055847273826
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-Agent Debate has emerged as a promising framework for improving the reasoning quality of large language models through iterative inter-agent communication. However, broadcasting all agent messages at every round introduces noise and redundancy that can degrade debate quality and waste computational resources. Current approaches rely on uncertainty estimation to filter low-confidence responses before broadcasting, but this approach is unreliable due to miscalibrated confidence scores and sensitivity to threshold selection. To address this, we propose Diversity-Aware Retention (DAR), a lightweight debate framework that, at each debate round, selects the subset of agent responses that maximally disagree with each other and with the majority vote before broadcasting. Through an explicit index-based retention mechanism, DAR preserves the original messages without modification, ensuring that retained disagreements remain authentic. Experiments on diverse reasoning and question answering benchmarks demonstrate that our selective message propagation consistently improves debate performance, particularly as the number of agents scales, where noise accumulation is most severe. Our results highlight that what agents hear is as important as what agents say in multi-agent reasoning systems.
- Abstract(参考訳): マルチエージェント・ディベート(Multi-Agent Debate)は,大規模言語モデルの推論品質を改善するためのフレームワークとして,反復的なエージェント間通信を通じて登場した。
しかし、各ラウンドで全てのエージェントメッセージをブロードキャストすることは、議論の質と無駄な計算資源を劣化させるノイズと冗長性をもたらす。
現在の手法は放送前の低信頼度応答をフィルタする不確実性推定に頼っているが、この手法は誤判定された信頼度スコアと閾値選択に対する感度のために信頼性が低い。
この問題に対処するため,各討論会において,最大で意見が一致しないエージェント応答のサブセットを選択し,放送前に多数決を行う軽量な討論フレームワークであるダイバーシティ・アウェア・リテンション(DAR)を提案する。
明示的なインデックスベースの保持機構を通じて、DARは元のメッセージを変更せずに保存し、保持された不一致が本物であることを保証する。
多様な推論および質問応答ベンチマークの実験により、選択的メッセージ伝搬は、特にノイズ蓄積が最も深刻なエージェントの数がスケールするにつれて、議論性能を一貫して改善することが示された。
我々の結果は、エージェントが聞くものは、エージェントがマルチエージェント推論システムで言うことと同じくらい重要であることを浮き彫りにしている。
関連論文リスト
- Balancing Faithfulness and Performance in Reasoning via Multi-Listener Soft Execution [79.98699884805636]
Reasoning Execution by Multiple Listeners (REMUL) は多人数の強化学習手法である。
REMULは、推論が他の当事者に従えるかがより忠実になるという仮説に基づいている。
スピーカーは、リスナーにとって明らかな推論を生み出すことで報われます。
論文 参考訳(メタデータ) (2026-02-18T02:55:55Z) - DynaDebate: Breaking Homogeneity in Multi-Agent Debate with Dynamic Path Generation [47.62978918069135]
DynaDebate (Dynamic Multi-Agent Debate) を導入し,3つのキーメカニズムによるマルチエージェント討論の有効性を高める。
大規模な実験により、DynaDebateは既存の最先端のMADメソッドを超越して、様々なベンチマークで優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-01-09T12:01:33Z) - OPTAGENT: Optimizing Multi-Agent LLM Interactions Through Verbal Reinforcement Learning for Enhanced Reasoning [14.105640933123325]
大規模言語モデル(LLM)は、数学的および科学的タスクにおいて顕著な推論能力を示している。
複雑な推論を強化するため、LLMエージェントの集合的知性を活用するためにマルチエージェントシステムが提案されている。
複数エージェントの協調構造を動的に構築・洗練する多エージェント言語強化学習アルゴリズムである$ours$を提案する。
論文 参考訳(メタデータ) (2025-10-20T19:07:51Z) - MADIAVE: Multi-Agent Debate for Implicit Attribute Value Extraction [52.89860691282002]
インプシット属性値抽出(AVE)は、電子商取引における商品の正確な表現に不可欠である。
マルチモーダル大言語モデル(MLLM)の進歩にもかかわらず、多次元データの複雑さのため暗黙のAVEは依然として困難である。
我々は,複数のMLLMエージェントを用いて推論を反復的に洗練するマルチエージェント討論フレームワークであるtextscmodelnameを紹介する。
論文 参考訳(メタデータ) (2025-10-07T06:27:42Z) - Debate Only When Necessary: Adaptive Multiagent Collaboration for Efficient LLM Reasoning [8.800516398660069]
大規模言語モデル(LLM)の推論能力を高めるための,有望なフレームワークとして,マルチエージェントコラボレーションが登場した。
本稿では,エージェントの初期応答の信頼性スコアに基づいて,議論を選択的に活性化する適応型マルチエージェント討論フレームワークであるDebate Only When Necessary (DOWN)を提案する。
ダウンは最大6倍の効率向上を実現し、既存のメソッドのパフォーマンスを保留する。
論文 参考訳(メタデータ) (2025-04-07T13:17:52Z) - DebUnc: Improving Large Language Model Agent Communication With Uncertainty Metrics [52.242449026151846]
大規模言語モデル(LLM)の精度向上のためのマルチエージェント論争が紹介されている。
エージェントの信頼性を評価するために不確実性指標を用いた議論フレームワークであるDebUncを提案する。
論文 参考訳(メタデータ) (2024-07-08T22:15:01Z) - ReConcile: Round-Table Conference Improves Reasoning via Consensus among Diverse LLMs [61.07130026622437]
大規模言語モデル(LLM)は、まだ自然言語推論タスクに苦戦している。
心の社会に動機づけられて、我々はReConcileを提案する。
LLMエージェント間のラウンドテーブル会議として設計されたマルチモデルマルチエージェントフレームワーク。
論文 参考訳(メタデータ) (2023-09-22T17:12:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。