論文の概要: From Debate to Deliberation: Structured Collective Reasoning with Typed Epistemic Acts
- arxiv url: http://arxiv.org/abs/2603.11781v1
- Date: Thu, 12 Mar 2026 10:39:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.020474
- Title: From Debate to Deliberation: Structured Collective Reasoning with Typed Epistemic Acts
- Title(参考訳): 討論から議論へ:タイプ付きてんかん行為による構造的集合的推論
- Authors: Sunil Prakash,
- Abstract要約: デリバティブ・コレクター・インテリジェンス(Deliberative Collective Intelligence, DCI)は、異なる参加者が型付き推論の動きを交換し、意見の不一致を保ち、説明責任のある結果に収束する段階的なプロセスである。
Gemini 2.5 Flashを使って、7つのドメインで45のタスクを評価します。
DCIは100%構造化された決定パケットと98%のマイノリティレポートを生成し、すべてのベースラインが欠落している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent LLM systems increasingly tackle complex reasoning, yet their interaction patterns remain limited to voting, unstructured debate, or pipeline orchestration. None model deliberation: a phased process where differentiated participants exchange typed reasoning moves, preserve disagreements, and converge on accountable outcomes. We introduce Deliberative Collective Intelligence (DCI), specifying four reasoning archetypes, 14 typed epistemic acts, a shared workspace, and DCI-CF, a convergent flow algorithm that guarantees termination with a structured decision packet containing the selected option, residual objections, minority report, and reopen conditions. We evaluate on 45 tasks across seven domains using Gemini 2.5 Flash. On non-routine tasks (n=40), DCI significantly improves over unstructured debate (+0.95, 95% CI [+0.41, +1.54]). DCI excels on hidden-profile tasks requiring perspective integration (9.56, highest of any system on any domain) while failing on routine decisions (5.39), confirming task-dependence. DCI produces 100% structured decision packets and 98% minority reports, artifacts absent from all baselines. However, DCI consumes ~62x single-agent tokens, and single-agent generation outperforms DCI on overall quality. DCI's contribution is not that more agents are better, but that consequential decisions benefit from deliberative structure when process accountability justifies the cost.
- Abstract(参考訳): マルチエージェントLLMシステムは複雑な推論に対処する傾向にあるが、その相互作用パターンは投票、非構造化討論、パイプラインオーケストレーションに限られている。
モデル検討: 区別された参加者が型付き推論の動きを交換し、意見の相違を保ち、説明可能な結果に収束する段階的なプロセス。
本稿では,選択された選択肢,残留する異議,少数報告,再オープン条件を含む構造化決定パケットによる終端を保証する収束フローアルゴリズムであるDCI-CFについて,4つの推論的アーキタイプ,14の型付き疫学的行為,共有ワークスペース,DCI-CFを提案する。
Gemini 2.5 Flashを使って、7つのドメインで45のタスクを評価します。
非ルーチンタスク(n=40)では、DCIは非構造化討論(+0.95, 95% CI [+0.41, +1.54])よりも著しく改善される。
DCIは、パースペクティブ統合を必要とする隠れたタスク(ドメイン上のどのシステムでも最高9.56)を排他的に処理するが、ルーチン決定(5.39)では失敗し、タスク依存が確認される。
DCIは100%構造化された決定パケットと98%のマイノリティレポートを生成し、すべてのベースラインが欠落している。
しかし、DCIは62倍のシングルエージェントトークンを消費し、シングルエージェント生成は全体的な品質でDCIを上回っている。
DCIの貢献は、より多くのエージェントがより優れているということではなく、プロセスのアカウンタビリティがコストを正当化するならば、その決定は熟考的な構造から恩恵を受けます。
関連論文リスト
- AgenticSimLaw: A Juvenile Courtroom Multi-Agent Debate Simulation for Explainable High-Stakes Tabular Decision Making [0.6218206949753592]
我々はAgenticSimLawを紹介した。これは、透明で制御可能なテストタイム推論を提供するロール構造化マルチエージェントの議論フレームワークである。
ブラックボックスアプローチとは異なり、裁判所スタイルのオーケストレーションでは、エージェントの役割を明確に定義しています。
NLSY97データセットを用いて、この枠組みを若者の復習予測にベンチマークする。
論文 参考訳(メタデータ) (2026-01-29T16:26:10Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Internalizing Self-Consistency in Language Models: Multi-Agent Consensus Alignment [22.305033366660187]
言語モデル(LM)は矛盾する推論子であり、しばしば同じプロンプトに対する矛盾した応答を生成する。
適切に整合した推論モデルの本質的な性質として自己整合性を定式化し、MACA(Multi-Agent Consensus Alignment)を導入する。
MACAは、エージェントが自分自身をより決定的かつ簡潔に教えることを可能にし、外部の監督なしにマルチエージェント設定におけるピアインサイトをより活用する。
論文 参考訳(メタデータ) (2025-09-18T17:27:28Z) - OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks [52.87238755666243]
OmniEARは,言語モデルが身体的相互作用やツールの使用,マルチエージェントの協調にどう影響するかを評価するためのフレームワークである。
我々は、家庭と工業領域にまたがる1500のシナリオにおける連続的な物理的特性と複雑な空間的関係をモデル化する。
我々の体系的な評価は、モデルが制約から推論しなければならない場合、厳しい性能劣化を示す。
論文 参考訳(メタデータ) (2025-08-07T17:54:15Z) - When Disagreements Elicit Robustness: Investigating Self-Repair Capabilities under LLM Multi-Agent Disagreements [56.29265568399648]
我々は、不一致が早期のコンセンサスを防ぎ、探索されたソリューション空間を拡張することを主張する。
タスククリティカルなステップの相違は、ソリューションパスのトポロジによってコラボレーションを損なう可能性がある。
論文 参考訳(メタデータ) (2025-02-21T02:24:43Z) - On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents [58.79302663733703]
大規模言語モデルに基づくマルチエージェントシステムは、専門家エージェントの協力により、様々なタスクにまたがる優れた能力を示している。
不器用なエージェントや悪意のあるエージェントが与える影響 - システム全体のパフォーマンスにおいて、頻繁にタスクでエラーを犯すものは、いまだに過小評価されていない。
本稿では,下流タスクにおける障害要因下での各種システム構造のレジリエンスについて検討する。
論文 参考訳(メタデータ) (2024-08-02T03:25:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。