論文の概要: DarkForest: Less Talk, Higher Accuracy for Multi-Agent LLMs
- arxiv url: http://arxiv.org/abs/2605.25188v1
- Date: Sun, 24 May 2026 17:34:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.953614
- Title: DarkForest: Less Talk, Higher Accuracy for Multi-Agent LLMs
- Title(参考訳): DarkForest:マルチエージェント LLM の低トーク,高精度化
- Authors: Yi Li, Songtao Wei, Dongming Jiang, Zhichun Guo, Qiannan Li, Bingzhe Li,
- Abstract要約: 我々はダークフォレストという制御通信協調フレームワークを提案する。
DarkForestはエージェントを独立に保持するため、各エージェントは他のエージェントの出力を見ることなく回答を生成する。
実験によると、DarkForestは全体的な品質をリードし、ベンチマーク指標で最強のベースラインを最大30.7%改善し、通信量の多いベースラインと比較してトークンの消費を最大6.5倍削減している。
- 参考スコア(独自算出の注目度): 8.797488068424181
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent LLM systems improve reasoning by combining outputs from multiple agents, but interaction-heavy methods can introduce error propagation and high communication overhead. When agents exchange raw responses or reasoning traces, incorrect intermediate reasoning may be adopted and amplified, leading to confident but wrong consensus; multi-round communication also increases token consumption, latency, and inference cost. In this paper, we propose a controlled-communication coordination framework named DarkForest. DarkForest first keeps agents independent, so each agent produces an answer without seeing the others' outputs. It then parses the raw responses into structured candidate records, groups semantically equivalent candidates into clusters, and estimates a calibrated belief distribution over these clusters using agent reliability, confidence, parse quality, support-pattern reliability, and independence corrections. A coordinator receives only policy-permitted evidence from this belief state with controlled communication. Experiments on six reasoning benchmarks show that DarkForest achieves leading overall quality, improves the strongest baseline by up to 30.7\% on benchmark metrics, and reduces token consumption by up to $6.5\times$ compared with communication-heavy baselines.
- Abstract(参考訳): マルチエージェントLLMシステムは複数のエージェントからの出力を組み合わせることで推論を改善するが、対話重畳法はエラー伝搬と高い通信オーバーヘッドを導入できる。
エージェントが生の応答や推論トレースを交換する場合、誤った中間推論が採用され、自信はあるが誤った合意につながる可能性がある。
本稿ではダークフォレストという制御通信協調フレームワークを提案する。
DarkForestはまずエージェントを独立に保持するため、各エージェントは他のエージェントの出力を見ることなく回答を生成する。
次に、生の応答を構造化された候補レコード、意味論的に等価な候補をクラスタに解析し、エージェント信頼性、信頼性、パース品質、サポートパターンの信頼性、独立性修正を使用して、これらのクラスタ上のキャリブレーションされた信念分布を推定する。
コーディネータは、制御された通信により、この信念状態からポリシーが許可された証拠のみを受信する。
6つの推論ベンチマークの実験は、DarkForestが全体的な品質をリードし、ベンチマーク指標で最強のベースラインを最大30.7\%改善し、通信量の多いベースラインと比較してトークン消費を最大6.5\times$に削減したことを示している。
関連論文リスト
- ExComm: Exploration-Stage Communication for Error-Resilient Agentic Test-Time Scaling [57.42714978834704]
ExCommは、探索段階のエージェントテストタイムスケーリングのための通信プロトコルである。
ExCommは、強いテスト時間スケーリングベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2026-05-21T07:38:44Z) - Balancing Faithfulness and Performance in Reasoning via Multi-Listener Soft Execution [79.98699884805636]
Reasoning Execution by Multiple Listeners (REMUL) は多人数の強化学習手法である。
REMULは、推論が他の当事者に従えるかがより忠実になるという仮説に基づいている。
スピーカーは、リスナーにとって明らかな推論を生み出すことで報われます。
論文 参考訳(メタデータ) (2026-02-18T02:55:55Z) - Auditing Multi-Agent LLM Reasoning Trees Outperforms Majority Vote and LLM-as-Judge [18.843205691780284]
我々はAgentAuditorを導入し、投票をReasoning Tree上のパス検索に置き換える。
AgentAuditorは、分岐を重要な分岐点で比較することで競合を解決する。
最大5%の得票率で絶対精度が向上し、最大3%の得票率でLLM-as-Judgeを使用する。
論文 参考訳(メタデータ) (2026-02-10T02:24:53Z) - AgentAsk: Multi-Agent Systems Need to Ask [26.13279490836716]
大規模言語モデル(LLM)上に構築されたマルチエージェントシステムは、協調的な分業による問題解決能力の向上を約束する。
我々はAgentAskを提案する。AgentAskは軽量でプラグ・アンド・プレイの明確化モジュールで、すべてのエージェント間メッセージを潜在的な障害点として扱い、エラーの伝播を抑えるのに必要最小限の質問を挿入する。
AgentAskは、公開マルチエージェント実装の精度と堅牢性を継続的に改善し、オーバーヘッドを最小限に抑え、レイテンシと余分なコストを5%以下に抑える。
論文 参考訳(メタデータ) (2025-10-08T22:36:05Z) - Internalizing Self-Consistency in Language Models: Multi-Agent Consensus Alignment [22.305033366660187]
言語モデル(LM)は矛盾する推論子であり、しばしば同じプロンプトに対する矛盾した応答を生成する。
適切に整合した推論モデルの本質的な性質として自己整合性を定式化し、MACA(Multi-Agent Consensus Alignment)を導入する。
MACAは、エージェントが自分自身をより決定的かつ簡潔に教えることを可能にし、外部の監督なしにマルチエージェント設定におけるピアインサイトをより活用する。
論文 参考訳(メタデータ) (2025-09-18T17:27:28Z) - DebUnc: Improving Large Language Model Agent Communication With Uncertainty Metrics [52.242449026151846]
大規模言語モデル(LLM)の精度向上のためのマルチエージェント論争が紹介されている。
エージェントの信頼性を評価するために不確実性指標を用いた議論フレームワークであるDebUncを提案する。
論文 参考訳(メタデータ) (2024-07-08T22:15:01Z) - ReConcile: Round-Table Conference Improves Reasoning via Consensus among Diverse LLMs [61.07130026622437]
大規模言語モデル(LLM)は、まだ自然言語推論タスクに苦戦している。
心の社会に動機づけられて、我々はReConcileを提案する。
LLMエージェント間のラウンドテーブル会議として設計されたマルチモデルマルチエージェントフレームワーク。
論文 参考訳(メタデータ) (2023-09-22T17:12:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。