論文の概要: Belief Engine: Configurable and Inspectable Stance Dynamics in Multi-Agent LLM Deliberation
- arxiv url: http://arxiv.org/abs/2605.15343v1
- Date: Thu, 14 May 2026 19:13:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.065738
- Title: Belief Engine: Configurable and Inspectable Stance Dynamics in Multi-Agent LLM Deliberation
- Title(参考訳): Belief Engine:マルチエージェントLLMにおける構成および検査可能なスタンスダイナミクス
- Authors: Joshua C. Yang, Maurice Flechtner, Damian Dailisan, Michiel A. Bakker,
- Abstract要約: 信念エンジン(Belief Engine, BE)は、ある命題に関する明白な状態として「信」を扱う、監査可能な信条更新層である。
BEは、構造化メモリに引数を抽出し、エビデンスUを取り込み、aをアンカーする前に制御されたログオードルールでスタンスを更新する。
DEBATEは、事前/ポストの意見を持つ人間の議論データセットで、BEは、最後のスタンスで証拠を抽出した参加者を最もよく再構成する。
- 参考スコア(独自算出の注目度): 0.299647994399672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LLM-based agents are increasingly used to simulate deliberative interactions such as negotiation, conflict resolution, and multi-turn opinion exchange. Yet generated transcripts often do not reveal why an agent's stance changes: movement may reflect evidence uptake, anchoring, role drift, echoing, or changed prompt and retrieval context. We introduce the Belief Engine (BE), an auditable belief-update layer that treats "belief" as an evidential state over a proposition and exposes it as scalar stance. BE extracts arguments into structured memory and updates stance with a log-odds rule controlled by evidence uptake u and prior anchoring a. Across multiple base LLMs, parameter sweeps show that these controls reliably shape stance dynamics while preserving an evidence-level update trail. On DEBATE, a human deliberation dataset with pre/post opinions, BE best reconstructs participants whose final stance follows extracted evidence; stable and evidence-opposed cases instead point to anchoring or factors outside the extracted evidence stream. BE provides configurable infrastructure for studying evidence-grounded deliberation, where openness, commitment, convergence, and disagreement can be tied to explicit update assumptions rather than hidden prompt effects.
- Abstract(参考訳): LLMベースのエージェントは、交渉、紛争解決、マルチターン意見交換などの熟考的相互作用をシミュレートするためにますます使われている。
動作は、証拠の取り込み、アンカー、ロールドリフト、エコー、またはプロンプトと検索コンテキストの変更を反映する可能性がある。
我々は,「信」を命題上の明白な状態として扱い,それをスカラーなスタンスとして公開する,監査可能な信条更新層であるBelief Engine(BE)を紹介した。
BEは、構造化メモリに引数を抽出し、エビデンスUを取り込み、aをアンカーする前に制御されたログオードルールでスタンスを更新する。
パラメータスイープは、複数のベースLLMにわたって、これらの制御がエビデンスレベルの更新パスを保持しながら、確実にスタンスダイナミクスを形作っていることを示している。
DEBATEでは、事前/ポストの意見を持つ人間の審議データセットで、BEは、最終姿勢が証拠を抽出した参加者を最もよく再構成する。
BEは、オープン性、コミットメント、収束性、不一致を隠された即効性ではなく明示的な更新仮定に結び付けることができるエビデンス基底の議論を研究するための、構成可能なインフラストラクチャを提供する。
関連論文リスト
- Agent-BRACE: Decoupling Beliefs from Actions in Long-Horizon Tasks via Verbalized State Uncertainty [70.43119366710778]
本稿では,Agens-BRACE: Agent Belief state Representation by Abstraction and Confidence Estimationを紹介する。
LLMエージェントを信頼状態モデルと政策モデルに分離し、強化学習を通じて協調的に最適化する手法である。
長期にわたる部分的に観察可能な言語環境において、平均して+14.5%の絶対的な改善を実現している。
論文 参考訳(メタデータ) (2026-05-12T02:37:04Z) - Tracking the Truth: Object-Centric Spatio-Temporal Monitoring for Video Large Language Models [154.39583176906893]
大規模言語モデル(ML)は高度な理解を持ち、シーンにおける幻覚の傾向が高い。
これは、時間的モニタリングの失敗、オブジェクトの動的アイデンティティ、状態、そして時間とともに関係を永続的に追跡する能力に起因している、と我々は主張する。
既存のベンチマークでは、局所的な視覚的手がかりや統計的先行によってしばしば解決される1つの最終回答クエリに頼って、この欠陥を曖昧にしている。
論文 参考訳(メタデータ) (2026-05-09T14:32:36Z) - TriEx: A Game-based Tri-View Framework for Explaining Internal Reasoning in Multi-Agent LLMs [16.622300148265275]
TriExは、整列されたアーティファクトでシーケンシャルな意思決定を行う、トリビュー説明可能性フレームワークである。
本稿では,TriExにより,説明の忠実さ,信念のダイナミクス,評価者の信頼性をスケーラブルに分析できることを示す。
論文 参考訳(メタデータ) (2026-04-21T22:55:57Z) - Preregistered Belief Revision Contracts [2.28438857884398]
PBRC(Preregistered Belief Revision Contracts)は,オープン通信と許容可能な変更を分離するプロトコルレベルのメカニズムである。
PBRC契約は、ファーストオーダーのエビデンストリガー、許容可能なリビジョンオペレータ、優先ルール、フォールバックポリシーを公に修正する。
本報告では,信頼軌道と正準化された監査トレースを保存したPBRC正規形式を,監査可能なトリガープロトコルで認めていることを示す。
論文 参考訳(メタデータ) (2026-04-16T22:22:54Z) - Verify Before You Commit: Towards Faithful Reasoning in LLM Agents via Self-Auditing [5.497064111008921]
我々は,行動開始前のエージェントの内部信頼状態に対する検証を行う新しいフレームワークであるtextbfSelf-textbfAudited textbfVerified textbfReasoning (textscSAVeR)を提案する。
当社のアプローチは、競争力のあるエンドタスクのパフォーマンスを維持しながら、推論の忠実さを継続的に改善します。
論文 参考訳(メタデータ) (2026-04-09T16:01:03Z) - LaSER: Internalizing Explicit Reasoning into Latent Space for Dense Retrieval [74.72139580745511]
LaSERは、レトリバーの潜在空間に明示的な推論を内部化する、新しい自己蒸留フレームワークである。
提案手法は, 明示的なCoTパイプラインの推論深度と, 標準的な高密度検索器の推論効率をうまく組み合わせる。
論文 参考訳(メタデータ) (2026-03-02T04:11:18Z) - Balancing Faithfulness and Performance in Reasoning via Multi-Listener Soft Execution [79.98699884805636]
Reasoning Execution by Multiple Listeners (REMUL) は多人数の強化学習手法である。
REMULは、推論が他の当事者に従えるかがより忠実になるという仮説に基づいている。
スピーカーは、リスナーにとって明らかな推論を生み出すことで報われます。
論文 参考訳(メタデータ) (2026-02-18T02:55:55Z) - Illusions of Confidence? Diagnosing LLM Truthfulness via Neighborhood Consistency [78.91846841708586]
完全な自己整合性で答えられた事実でさえ、軽微な文脈干渉の下で急速に崩壊することを示します。
本研究では,概念的近傍における応答コヒーレンスを評価する信念の構造尺度であるNighbor-Consistency Belief(NCB)を提案する。
また、文脈不変の信念構造を最適化し、長い知識の脆さを約30%低減する構造意識訓練(SAT)を提案する。
論文 参考訳(メタデータ) (2026-01-09T16:23:21Z) - The Facade of Truth: Uncovering and Mitigating LLM Susceptibility to Deceptive Evidence [49.94160400740222]
MisBeliefは、協調的な多ラウンドの相互作用によって誤解を招く証拠を生成するフレームワークである。
MisBeliefを用いて、3つの難易度で4,800のインスタンスを生成し、7つの代表的なLCMを評価する。
結果は、モデルは直接的な誤報に対して堅牢であるが、この洗練された証拠に非常に敏感であることを示している。
本稿では,疑似意図を証拠裏で推測することにより早期警告信号を提供するガバナンス機構である,認知的意図遮蔽(DIS)を提案する。
論文 参考訳(メタデータ) (2026-01-09T02:28:00Z) - Rational Synthesizers or Heuristic Followers? Analyzing LLMs in RAG-based Question-Answering [0.0]
GroupQAは15,058件の多種多様な証拠文書と組み合わせて、1,635件の論争を巻き起こしたデータセットである。
グループレベルのエビデンス・アグリゲーション・ダイナミクスを制御実験により特徴づける。
グループベースの回答に対する LLM の説明は不信であることがわかった。
論文 参考訳(メタデータ) (2026-01-08T01:54:21Z) - CRAVE: A Conflicting Reasoning Approach for Explainable Claim Verification Using LLMs [15.170312674645535]
CRAVE は、説明可能なクレーム VErification に対する Conflicting Reasoning Approach である。
大規模な言語モデルによって推論される矛盾する理性に基づいて、複雑なクレームを検証することができる。
CRAVEは最先端の手法よりもはるかに優れた性能を実現している。
論文 参考訳(メタデータ) (2025-04-21T07:20:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。