論文の概要: CoE: Collaborative Entropy for Uncertainty Quantification in Agentic Multi-LLM Systems
- arxiv url: http://arxiv.org/abs/2603.28360v1
- Date: Mon, 30 Mar 2026 12:28:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.387113
- Title: CoE: Collaborative Entropy for Uncertainty Quantification in Agentic Multi-LLM Systems
- Title(参考訳): CoE:エージェントマルチLLMシステムにおける不確実性定量のための協調エントロピー
- Authors: Kangkang Sun, Jun Wu, Jianhua Li, Minyi Guo, Xiuzhen Che, Jianwei Huang,
- Abstract要約: マルチLLMシステムにおける不確実性推定は、主に単一モデル中心である。
複数LLM協調における意味的不確実性のための統合情報理論計量である協調エントロピー(CoE)を提案する。
- 参考スコア(独自算出の注目度): 27.06344333036998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Uncertainty estimation in multi-LLM systems remains largely single-model-centric: existing methods quantify uncertainty within each model but do not adequately capture semantic disagreement across models. To address this gap, we propose Collaborative Entropy (CoE), a unified information-theoretic metric for semantic uncertainty in multi-LLM collaboration. CoE is defined on a shared semantic cluster space and combines two components: intra-model semantic entropy and inter-model divergence to the ensemble mean. CoE is not a weighted ensemble predictor; it is a system-level uncertainty measure that characterizes collaborative confidence and disagreement. We analyze several core properties of CoE, including non-negativity, zero-value certainty under perfect semantic consensus, and the behavior of CoE when individual models collapse to delta distributions. These results clarify when reducing per-model uncertainty is sufficient and when residual inter-model disagreement remains. We also present a simple CoE-guided, training-free post-hoc coordination heuristic as a practical application of the metric. Experiments on \textit{TriviaQA} and \textit{SQuAD} with LLaMA-3.1-8B-Instruct, Qwen-2.5-7B-Instruct, and Mistral-7B-Instruct show that CoE provides stronger uncertainty estimation than standard entropy- and divergence-based baselines, with gains becoming larger as additional heterogeneous models are introduced. Overall, CoE offers a useful uncertainty-aware perspective on multi-LLM collaboration.
- Abstract(参考訳): 既存の手法は各モデル内の不確実性を定量化するが、モデル間のセマンティックな不一致を適切に捉えない。
このギャップに対処するために,複数LLMコラボレーションにおける意味的不確実性のための統合情報理論計量であるCoE(Collaborative Entropy)を提案する。
CoEは共有セマンティッククラスタ空間上で定義され、モデル内のセマンティックエントロピーと、アンサンブル平均へのモデル間分岐という2つのコンポーネントを組み合わせる。
CoEは重み付けされたアンサンブル予測器ではなく、協調的な信頼と不一致を特徴づけるシステムレベルの不確実性尺度である。
完全セマンティック・コンセンサスの下での非負性,ゼロ値確実性,および個々のモデルがデルタ分布に崩壊した場合のCoEの挙動など,CoEのコア特性を解析した。
これらの結果から,モデル間不確実性の低減が十分であり,モデル間不一致が残存する場合が明らかとなった。
また, 簡単なCoE誘導, トレーニング不要なポストホック協調ヒューリスティックを, 計量の実用的応用として提示する。
LLaMA-3.1-8B-インストラクト、Qwen-2.5-7B-インストラクト、Mistral-7B-インストラクトによる \textit{TriviaQA} と \textit{SQuAD} の実験は、CoEが標準エントロピーおよび発散に基づくベースラインよりも強い不確実性推定を提供し、さらにヘテロジニアスモデルを導入するにつれてゲインが大きくなることを示している。
全体として、CoEはマルチLLMコラボレーションにおいて有用な不確実性を考慮した視点を提供する。
関連論文リスト
- Gaussian Joint Embeddings For Self-Supervised Representation Learning [0.0]
自己パラメトリック表現学習は、しばしば決定論的予測アーキテクチャに頼り、潜在空間におけるコンテキストとターゲットビューを整列させる。
生成的関節モデルに基づく確率的代替案を提案する。
論文 参考訳(メタデータ) (2026-03-26T00:54:54Z) - No Single Metric Tells the Whole Story: A Multi-Dimensional Evaluation Framework for Uncertainty Attributions [0.31498833540989407]
入力特徴に起因して予測の不確実性を説明する手法が提案されている。
本稿では, 正確性, 一貫性, 連続性, コンパクト性に関する具体的実装を提案する。
我々は,不確実性定量化と特徴帰属法を組み合わせた8つの指標を用いた評価枠組みを実証した。
論文 参考訳(メタデータ) (2026-03-25T17:02:13Z) - Rethinking Uncertainty Quantification and Entanglement in Image Segmentation [8.952491535016444]
不確実性(UQ)は、医療画像セグメンテーションのような安全上重要な応用において重要である。
AU(確率的UNet、拡散など)やEU(アンサンブル、MCDropoutなど)のモデリングには多くの方法があるが、どのように相互作用するかは定かではない。
本稿では、幅広いAU-EUモデルの組み合わせを網羅した総合的な実証研究を行い、不確実性の絡み合いを定量化するための指標を提案し、下流UQタスクの両方を評価する。
論文 参考訳(メタデータ) (2026-03-19T11:43:26Z) - Decoupling the Effect of Chain-of-Thought Reasoning: A Human Label Variation Perspective [60.45433515408158]
長いチェーン・オブ・ソート(CoT)がトップオプションの決定的決定要因となるが、あいまいなタスクの粒度分布キャリブレータとして機能しないことを示す。
CoTは分布アライメントを改善するが、CoTの内容によって最終的な精度が決定される。
論文 参考訳(メタデータ) (2026-01-06T16:26:40Z) - Divergence-Minimization for Latent-Structure Models: Monotone Operators, Contraction Guarantees, and Robust Inference [5.373905622325275]
我々は、潜時混合モデルにおける堅牢かつ効率的な推論のための分散化最小化(DM)フレームワークを開発する。
残留調整された発散を最適化することにより、DMアプローチはEMを特別なケースとして回収し、堅牢な代替品を生成する。
論文 参考訳(メタデータ) (2025-11-22T08:25:29Z) - Harnessing Consistency for Robust Test-Time LLM Ensemble [88.55393815158608]
CoREは、堅牢なLLMアンサンブルにモデル一貫性を利用するプラグイン・アンド・プレイ技術である。
トークンレベルの一貫性は、ダウンウェイト不確実なトークンにローパスフィルタを適用することで、きめ細かい不一致を捕捉する。
モデルレベルの一貫性は、自己自信の高いモデル出力を促進することで、グローバルな合意をモデル化する。
論文 参考訳(メタデータ) (2025-10-12T04:18:45Z) - Simple Yet Effective: An Information-Theoretic Approach to Multi-LLM Uncertainty Quantification [9.397157329808254]
MUSEは、大規模言語モデルのよく校正されたサブセットを特定し、集約するための単純な情報理論手法である。
二分予測タスクの実験では、単一モデルとナイーブアンサンブルベースラインと比較してキャリブレーションと予測性能が改善された。
論文 参考訳(メタデータ) (2025-07-09T19:13:25Z) - Decomposing Uncertainty for Large Language Models through Input Clarification Ensembling [69.83976050879318]
大規模言語モデル(LLM)では、不確実性の原因を特定することが、信頼性、信頼性、解釈可能性を改善するための重要なステップである。
本稿では,LLMのための不確実性分解フレームワークについて述べる。
提案手法は,入力に対する一連の明確化を生成し,それらをLLMに入力し,対応する予測をアンサンブルする。
論文 参考訳(メタデータ) (2023-11-15T05:58:35Z) - Measuring and Modeling Uncertainty Degree for Monocular Depth Estimation [50.920911532133154]
単分子深度推定モデル(MDE)の本質的な不適切さと順序感性は、不確かさの程度を推定する上で大きな課題となる。
本稿では,MDEモデルの不確かさを固有確率分布の観点からモデル化する。
新たなトレーニング正規化用語を導入することで、驚くほど単純な構成で、余分なモジュールや複数の推論を必要とせずに、最先端の信頼性で不確実性を推定できる。
論文 参考訳(メタデータ) (2023-07-19T12:11:15Z) - Collaborative Uncertainty Benefits Multi-Agent Multi-Modal Trajectory Forecasting [61.02295959343446]
この研究はまず、相互作用モジュールから生じる不確実性をモデル化する新しい概念であるコラボレーティブ不確実性(CU)を提案する。
我々は、回帰と不確実性推定の両方を行うために、元の置換同変不確かさ推定器を備えた一般的なCU対応回帰フレームワークを構築した。
提案するフレームワークを,プラグインモジュールとして現在のSOTAマルチエージェント軌道予測システムに適用する。
論文 参考訳(メタデータ) (2022-07-11T21:17:41Z) - Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma
Distributions [91.63716984911278]
このアルゴリズムは、異なるモードの適応的統合の原理における不確かさを効率的に推定し、信頼できる回帰結果を生成する。
実世界のデータと実世界のデータの両方に対する実験結果から,多モード回帰タスクにおける本手法の有効性と信頼性が示された。
論文 参考訳(メタデータ) (2021-11-11T14:28:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。