Fugu-MT 論文翻訳(概要): CascadeDebate: Multi-Agent Deliberation for Cost-Aware LLM Cascades

論文の概要: CascadeDebate: Multi-Agent Deliberation for Cost-Aware LLM Cascades

arxiv url: http://arxiv.org/abs/2604.12262v1
Date: Tue, 14 Apr 2026 04:26:39 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-15 19:11:32.233115
Title: CascadeDebate: Multi-Agent Deliberation for Cost-Aware LLM Cascades
Title（参考訳）: CascadeDebate: コスト対応LLMカスケードのマルチエージェント検討
Authors: Raeyoung Chang, Dongwook Kwon, Jisoo Lee, Nikhil Verma,
Abstract要約: CascadeDebateは、モデルと人間の専門家を協調して精度、コスト、そして不確実性の下での棄権のバランスをとるマルチエージェントシステムである。我々のアーキテクチャは、モデルスケールにまたがる選択的なマルチエージェント検討と単一モデル推論を交互に行い、最終的なフォールバックとして人間の専門家を導いた。科学、医学、一般知識にまたがる5つのベンチマークで、CascadeDebateは強力なシングルモデルカスケードとスタンドアロンのマルチエージェントシステムより最大26.75パーセントパフォーマンスがある。
参考スコア（独自算出の注目度）: 3.2562960801091094
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Cascaded LLM systems coordinate models of varying sizes with human experts to balance accuracy, cost, and abstention under uncertainty. However, single-model tiers at each stage often struggle with ambiguous queries, triggering premature escalations to costlier models or experts due to under-confidence and inefficient compute scaling. CascadeDebate addresses this gap by inserting multi-agent deliberation directly at each tier's escalation boundary. Confidence-based routers activate lightweight agent ensembles only for uncertain cases, enabling consensus-driven resolution of ambiguities internally without invoking higher-cost upgrades. Our unified architecture alternates single-model inference with selective multi-agent deliberation across model scales, culminating in human experts as the final fallback. This design scales test-time compute dynamically according to query difficulty. Across five benchmarks spanning science, medicine, and general knowledge, CascadeDebate outperforms strong single-model cascades and standalone multi-agent systems by up to 26.75 percent. An online threshold optimizer proves essential, boosting accuracy by 20.98 to 52.33 percent relative improvement over fixed policies and enabling elastic adaptation to real-world distributions.
Abstract（参考訳）: カスケードLLMシステムは、不確実性の下で正確さ、コスト、棄権のバランスをとるために、人間の専門家と様々なサイズのモデルを調整する。しかし、各ステージのシングルモデル層は曖昧なクエリに苦しむことが多く、信頼性の低い計算スケーリングと非効率な計算スケーリングのために、コストの低いモデルや専門家に早めのエスカレーションを引き起こす。 CascadeDebateは、各階層のエスカレーション境界に直接マルチエージェントの審議を挿入することで、このギャップに対処する。信頼性ベースのルータは、不確実な場合にのみ軽量エージェントアンサンブルを起動し、高コストアップグレードを発生させることなく、内部での曖昧性のコンセンサス駆動の解決を可能にする。我々の統一アーキテクチャは、モデルスケールをまたいだ選択的なマルチエージェント検討と単一モデル推論を交互に行い、最終的なフォールバックとして人間の専門家を導いた。この設計はクエリの難易度に応じてテスト時間計算を動的にスケールする。科学、医学、一般知識にまたがる5つのベンチマークで、CascadeDebateは強力なシングルモデルカスケードとスタンドアロンのマルチエージェントシステムより最大26.75パーセントパフォーマンスがある。オンラインしきい値オプティマイザは必須であり、固定されたポリシーよりも精度を20.98から52.33%向上させ、現実世界の分布に弾力的な適応を可能にする。

論文の概要: CascadeDebate: Multi-Agent Deliberation for Cost-Aware LLM Cascades

関連論文リスト