論文の概要: The impact of multi-agent debate protocols on debate quality: a controlled case study
- arxiv url: http://arxiv.org/abs/2603.28813v1
- Date: Sat, 28 Mar 2026 11:36:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:02.548268
- Title: The impact of multi-agent debate protocols on debate quality: a controlled case study
- Title(参考訳): マルチエージェント討論プロトコルが議論品質に及ぼす影響--制御された事例研究
- Authors: Ramtin Zargari Marandi,
- Abstract要約: マルチエージェント討論システムにおける3つの主要なプロトコルを比較した。
RA-CRはエージェントを動的にリオーダーし、外部のジャッジモデルを介して1ラウンドずつサイレントする。
その結果、相互作用(ピア参照率)と収束(合意形成)のトレードオフが明らかになった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In multi-agent debate (MAD) systems, performance gains are often reported; however, because the debate protocol (e.g., number of agents, rounds, and aggregation rule) is typically held fixed while model-related factors vary, it is difficult to disentangle protocol effects from model effects. To isolate these effects, we compare three main protocols, Within-Round (WR; agents see only current-round contributions), Cross-Round (CR; full prior-round context), and novel Rank-Adaptive Cross-Round (RA-CR; dynamically reorders agents and silences one per round via an external judge model), against a No-Interaction baseline (NI; independent responses without peer visibility). In a controlled macroeconomic case study (20 diverse events, five random seeds, matched prompts/decoding), RA-CR achieves faster convergence than CR, WR shows higher peer-referencing, and NI maximizes Argument Diversity (unaffected across the main protocols). These results reveal a trade-off between interaction (peer-referencing rate) and convergence (consensus formation), confirming protocol design matters. When consensus is prioritized, RA-CR outperforms the others.
- Abstract(参考訳): マルチエージェントディベート(MAD)システムでは、性能向上が報告されることが多いが、議論プロトコル(例えば、エージェントの数、ラウンド数、集約ルール)は一般に固定され、モデル関連要因が異なるため、モデル効果からプロトコル効果を遠ざけることは困難である。
これらの効果を分離するために、Inside-Round (WR; agent see only current-round contributions), Cross-Round (CR; full pre-round context), and novel Rank-Adaptive Cross-Round (RA-CR; dynamic reorders agent and quiets one per round via a external judge model), and to not no-Interaction baseline (NI; independent response without peer visible)という3つの主要なプロトコルを比較した。
制御されたマクロ経済ケーススタディ(20の多様な事象、5つのランダムシード、マッチしたプロンプト/デコーディング)では、RA-CRはCRよりも早く収束し、WRはより高いピア参照を示し、NIはArgument Diversity(主要なプロトコルに影響を与えない)を最大化する。
これらの結果は、相互作用(ピア参照率)と収束(合意形成)のトレードオフを明らかにし、プロトコル設計の問題を確認する。
コンセンサスを優先すると、RA-CRは他よりも優れる。
関連論文リスト
- Courtroom-Style Multi-Agent Debate with Progressive RAG and Role-Switching for Controversial Claim Verification [2.464003792743989]
大型言語モデル (LLM) は、幻覚や浅い推論のため、高い精度のクレーム検証には信頼できないままである。
本稿では, 検証を構造化された, 反対の審議会として再編成する, 裁判所方式のマルチエージェントフレームワーク PROClaim を提案する。
提案手法は,プログレッシブRAG (Progressive RAG, P-RAG) と特別な役割(プレーンティフ, ディフェンス, ジャッジ)を統合し, 議論の間, 証拠プールを動的に拡大・洗練する。
論文 参考訳(メタデータ) (2026-03-30T14:23:15Z) - Hear Both Sides: Efficient Multi-Agent Debate via Diversity-Aware Message Retention [31.583055847273826]
Multi-Agent Debateは、大規模言語モデルの推論品質を改善するための有望なフレームワークとして登場した。
現在のアプローチは、放送前の低信頼応答をフィルタする不確実性推定に依存している。
本稿では,エージェント応答のサブセットを選択する軽量な討論フレームワークであるDiversity-Aware Retention (DAR)を提案する。
論文 参考訳(メタデータ) (2026-03-21T04:27:47Z) - AgenticSimLaw: A Juvenile Courtroom Multi-Agent Debate Simulation for Explainable High-Stakes Tabular Decision Making [0.6218206949753592]
我々はAgenticSimLawを紹介した。これは、透明で制御可能なテストタイム推論を提供するロール構造化マルチエージェントの議論フレームワークである。
ブラックボックスアプローチとは異なり、裁判所スタイルのオーケストレーションでは、エージェントの役割を明確に定義しています。
NLSY97データセットを用いて、この枠組みを若者の復習予測にベンチマークする。
論文 参考訳(メタデータ) (2026-01-29T16:26:10Z) - DynaDebate: Breaking Homogeneity in Multi-Agent Debate with Dynamic Path Generation [47.62978918069135]
DynaDebate (Dynamic Multi-Agent Debate) を導入し,3つのキーメカニズムによるマルチエージェント討論の有効性を高める。
大規模な実験により、DynaDebateは既存の最先端のMADメソッドを超越して、様々なベンチマークで優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-01-09T12:01:33Z) - Argument-Centric Causal Intervention Method for Mitigating Bias in Cross-Document Event Coreference Resolution [12.185497507437555]
クロスドキュメントイベント参照解決(CD-ECR)は、複数のドキュメントにまたがるイベントの言及が、同じ実世界の出来事を指すかどうかを判断する。
本稿ではArgument-Centric Causal Intervention(ACCI)に基づく新しい手法を提案する。
ACCIは、引き起こし語摂動の因果的影響を定量化する反ファクト的推論モジュールと、意味論的根拠のある情報に対する高い感度を促進するために、引数認識拡張モジュールを統合する。
論文 参考訳(メタデータ) (2025-06-02T09:46:59Z) - Bidirectional Decoding: Improving Action Chunking via Guided Test-Time Sampling [51.38330727868982]
動作チャンキングが学習者と実証者の間の分岐にどのように影響するかを示す。
動作チャンキングをクローズドループ適応でブリッジするテスト時間推論アルゴリズムである双方向デコーディング(BID)を提案する。
提案手法は、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させる。
論文 参考訳(メタデータ) (2024-08-30T15:39:34Z) - RAT: Retrieval-Augmented Transformer for Click-Through Rate Prediction [68.34355552090103]
本稿では, 試料内および試料間における微細な特徴相互作用の獲得を目的とした検索-拡張変換器(RAT)を開発した。
次に、トランスフォーマー層をカスケードされた注意で構築し、イントラサンプルとクロスサンプルの両方の機能インタラクションをキャプチャします。
実世界のデータセットの実験は、RATの有効性を裏付け、ロングテールシナリオにおいてその利点を示唆している。
論文 参考訳(メタデータ) (2024-04-02T19:14:23Z) - ReConcile: Round-Table Conference Improves Reasoning via Consensus among Diverse LLMs [61.07130026622437]
大規模言語モデル(LLM)は、まだ自然言語推論タスクに苦戦している。
心の社会に動機づけられて、我々はReConcileを提案する。
LLMエージェント間のラウンドテーブル会議として設計されたマルチモデルマルチエージェントフレームワーク。
論文 参考訳(メタデータ) (2023-09-22T17:12:45Z) - Plug-and-Play Regulators for Image-Text Matching [76.28522712930668]
微細な対応と視覚的セマンティックなアライメントの爆発は、画像とテキストのマッチングにおいて大きな可能性を秘めている。
我々は、メッセージ出力を効率的にエンコードして、コンテキストを自動生成し、モーダル表現を集約する、シンプルだが非常に効果的な2つのレギュレータを開発した。
MSCOCOとFlickr30Kデータセットの実験は、複数のモデルで印象的で一貫したR@1ゲインをもたらすことができることを実証している。
論文 参考訳(メタデータ) (2023-03-23T15:42:05Z) - IPCC-TP: Utilizing Incremental Pearson Correlation Coefficient for Joint
Multi-Agent Trajectory Prediction [73.25645602768158]
IPCC-TPはインクリメンタルピアソン相関係数に基づく新しい関連認識モジュールであり,マルチエージェントインタラクションモデリングを改善する。
我々のモジュールは、既存のマルチエージェント予測手法に便利に組み込んで、元の動き分布デコーダを拡張することができる。
論文 参考訳(メタデータ) (2023-03-01T15:16:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。