論文の概要: Multi-agent decision making: A Blackwell's informativeness approach
- arxiv url: http://arxiv.org/abs/2605.06028v1
- Date: Thu, 07 May 2026 11:19:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.717475
- Title: Multi-agent decision making: A Blackwell's informativeness approach
- Title(参考訳): マルチエージェント意思決定:Blackwellの情報化アプローチ
- Authors: Zheng Zhang, Cuong C. Nguyen, Kevin Wells, Gustavo Carneiro,
- Abstract要約: ブラックウェルの情報化フレームワークを用いて,マルチLLM設定における決定を解析する原理的手法を提案する。
投票や討論は、全てのエージェントのプールされたプライベート情報よりも情報的でない情報構造を誘導することを示します。
本稿では,各エージェントの後部を推定し,後部積推定器を用いてプールした後部を近似する質問応答タスクの実践的手法を提案する。
- 参考スコア(独自算出の注目度): 16.194822252442567
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid development of large language models (LLMs) has motivated research on decision-making in multi-agent systems, where multiple agents collaborate to achieve shared objectives. Existing aggregation approaches, such as voting and debate, are largely ad-hoc and lack formal guarantees regarding the informativeness of the resulting decisions. In this paper, we provide a principled approach to analyse decisions made in the multi-LLM setting using Blackwell's informativeness framework. Within the Blackwell information-structure abstraction, we show that voting and debate induce information structures that are no more informative than the pooled private information of all agents. This result identifies Bayesian pooled posterior maximisation as an information-theoretic upper-bound decision rule under the Blackwell ordering. Motivated by this theoretical analysis, we introduce a practical method for LLM-based question-answering (QA) tasks that estimates each agent's posterior and approximates the pooled posterior using a product-of-posteriors estimator. Extensive experiments on six QA benchmarks demonstrate that our approach outperforms state-of-the-art multi-LLM debate and voting methods.
- Abstract(参考訳): 大規模言語モデル(LLM)の急速な発展は、複数のエージェントが協調して共通の目的を達成するマルチエージェントシステムにおける意思決定の研究を動機付けている。
投票や討論のような既存の集約アプローチは概ねアドホックであり、結果として得られる決定の情報性に関する公式な保証を欠いている。
本稿では,ブラックウェルの情報化フレームワークを用いたマルチLLM設定における意思決定の原理的分析手法を提案する。
ブラックウェル情報構造抽象化では、投票や討論は、全てのエージェントのプールされたプライベート情報よりも情報的でない情報構造を誘導する。
この結果は、ベイズプールの後方最大化をブラックウェル順序付けの下での情報理論上界決定規則として特定する。
この理論解析により,各エージェントの後部を推定し,後部推定器を用いてプールした後部を近似する,LCMに基づく質問応答(QA)タスクの実践的手法を提案する。
6つのQAベンチマークの大規模な実験により、我々のアプローチは最先端のマルチLLM討論や投票方法よりも優れていることが示された。
関連論文リスト
- Debate to Align: Reliable Entity Alignment through Two-Stage Multi-Agent Debate [13.025981335381637]
我々はマルチエージェントの議論に基づく信頼できるEAフレームワークであるAgentEAを提案する。
AgentEAはエンティティ表現の優先順位最適化を通じて埋め込み品質を改善する。
次に、軽量な議論検証と深い議論アライメントからなる2段階のマルチロール討論機構を導入する。
論文 参考訳(メタデータ) (2026-04-15T06:54:27Z) - RecThinker: An Agentic Framework for Tool-Augmented Reasoning in Recommendation [63.74915464611075]
RecThinkerはツール拡張推論を推奨するエージェントフレームワークである。
我々はRecThinker専用のツール群を開発し、モデルがユーザアイテム側および協調的な情報を取得することを可能にする。
論文 参考訳(メタデータ) (2026-03-10T16:07:17Z) - Advancing Adaptive Multi-Stage Video Anomaly Reasoning: A Benchmark Dataset and Method [96.63801368613177]
本稿では,記述的理解から構造化多段階推論への映像異常解析を向上するタスクを提案する。
我々は8,641本のビデオからなる新しいデータセットを提示し、合計5万本以上のサンプルを作成し、ビデオ異常理解のための最大のデータセットの1つである。
提案したタスクとデータセットに基づいて,適応的階層的推論とリスク認識意思決定をサポートする,Vad-R1-Plusと呼ばれるエンドツーエンドのMLLMベースのVARモデルを開発する。
論文 参考訳(メタデータ) (2026-01-15T08:09:04Z) - LLMs for Explainable Business Decision-Making: A Reinforcement Learning Fine-Tuning Approach [9.942833203981069]
大規模言語モデル(LLM)は、自然言語の説明を生成する機会を提供する。
観客に適切な説明を与える強化学習に基づく微調整フレームワークであるLEXMAを紹介する。
LEXMAは他のLLMベースラインに比べて予測性能が大幅に向上した。
論文 参考訳(メタデータ) (2025-12-10T04:16:31Z) - Explaining Decentralized Multi-Agent Reinforcement Learning Policies [23.723793486760325]
本稿では,分散MARL政策におけるタスクオーダリングとエージェント協調をキャプチャする政策要約を生成する手法を提案する。
我々は4つのMARL領域と2つの分散MARLアルゴリズムにまたがるアプローチを評価し、その一般化性と計算効率を実証した。
論文 参考訳(メタデータ) (2025-11-13T15:30:02Z) - Beyond Majority Voting: LLM Aggregation by Leveraging Higher-Order Information [57.397381631496906]
最適重み(OW)と逆サプライシング人気度(ISP)という2つの新しいアグリゲーションアルゴリズムを開発した。
我々の理論的分析は、これらの手法が軽微な仮定の下での多数決の本質的な制限を確実に緩和することを示している。
我々は,我々のアルゴリズムを人工データセット,UltraFeedbackやMMLUなどのLLMファインチューニングベンチマーク,実世界の医療環境ARMMAN上で実証的に検証した。
論文 参考訳(メタデータ) (2025-10-01T22:21:50Z) - AgentCDM: Enhancing Multi-Agent Collaborative Decision-Making via ACH-Inspired Structured Reasoning [8.566904810788213]
AgentCDMはマルチエージェントシステムにおける協調的意思決定を強化するための構造化フレームワークである。
認知バイアスを内部化し、意思決定を受動的回答の選択からアクティブな仮説評価と構築へとシフトさせる。
複数のベンチマークデータセットの実験は、AgentCDMが最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-08-16T09:46:04Z) - UProp: Investigating the Uncertainty Propagation of LLMs in Multi-Step Agentic Decision-Making [47.64013151246807]
大規模言語モデル(LLM)は、シーケンシャルな意思決定を含む安全クリティカルなアプリケーションに統合される。
既存のLLM Uncertainty Quantification (UQ) 法は、主にシングルターン質問応答形式のために設計されている。
LLMシーケンシャルな決定の不確かさを2つの部分に分解する原理的情報理論フレームワークを導入する。
論文 参考訳(メタデータ) (2025-06-20T18:34:04Z) - Large Multimodal Agents: A Survey [78.81459893884737]
大規模言語モデル(LLM)は、テキストベースのAIエージェントのパワーで優れたパフォーマンスを実現している。
LLMを利用したAIエージェントをマルチモーダルドメインに拡張することに焦点を当てた、新たな研究トレンドがある。
本総説は, この急速に発展する分野において, 今後の研究に有用な洞察とガイドラインを提供することを目的としている。
論文 参考訳(メタデータ) (2024-02-23T06:04:23Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。