論文の概要: Debating the Unspoken: Role-Anchored Multi-Agent Reasoning for Half-Truth Detection
- arxiv url: http://arxiv.org/abs/2604.19005v1
- Date: Tue, 21 Apr 2026 02:46:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.581978
- Title: Debating the Unspoken: Role-Anchored Multi-Agent Reasoning for Half-Truth Detection
- Title(参考訳): ハーフトルース検出のためのロールアンコールマルチエージェント推論
- Authors: Yixuan Tang, Yirui Zhang, Hang Feng, Anthony K. H. Tung,
- Abstract要約: 半真実の主張は、事実検証システムの盲点として残っています。
本稿では,役割認識型マルチエージェント討論フレームワークRADARを提案する。
- 参考スコア(独自算出の注目度): 14.369051221271187
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Half-truths, claims that are factually correct yet misleading due to omitted context, remain a blind spot for fact verification systems focused on explicit falsehoods. Addressing such omission-based manipulation requires reasoning not only about what is said, but also about what is left unsaid. We propose RADAR, a role-anchored multi-agent debate framework for omission-aware fact verification under realistic, noisy retrieval. RADAR assigns complementary roles to a Politician and a Scientist, who reason adversarially over shared retrieved evidence, moderated by a neutral Judge. A dual-threshold early termination controller adaptively decides when sufficient reasoning has been reached to issue a verdict. Experiments show that RADAR consistently outperforms strong single- and multi-agent baselines across datasets and backbones, improving omission detection accuracy while reducing reasoning cost. These results demonstrate that role-anchored, retrieval-grounded debate with adaptive control is an effective and scalable framework for uncovering missing context in fact verification. The code is available at https://github.com/tangyixuan/RADAR.
- Abstract(参考訳): 半真実は事実的に正しいが、文脈が省略されたために誤解を招くという主張は、明らかな虚偽に焦点を絞った事実検証システムにとって盲点のままである。
このような省略に基づく操作に対処するには、何を言ったかだけでなく、何が残されているかについても推論する必要がある。
本稿では,現実的,ノイズの多い検索条件下での未確認事実検証のための役割認識型マルチエージェント討論フレームワークRADARを提案する。
RADARは、政治学者と科学者に補完的な役割を割り当て、中立の裁判官によって仲裁された、共有された証拠について敵対的に主張する。
二重閾値早期終了制御器は、判定を発行する十分な推論が到達した時点で適応的に決定する。
実験によると、RADARはデータセットとバックボーンをまたいだ強力なシングルエージェントベースラインとマルチエージェントベースラインを一貫して上回り、推論コストを削減し、省略検出精度を向上させる。
これらの結果から, 適応制御を用いた役割認識・検索に基づく議論は, 事実検証において欠落した文脈を明らかにする上で, 効果的かつスケーラブルな枠組みであることが示唆された。
コードはhttps://github.com/tangyixuan/RADAR.comで公開されている。
関連論文リスト
- Courtroom-Style Multi-Agent Debate with Progressive RAG and Role-Switching for Controversial Claim Verification [2.464003792743989]
大型言語モデル (LLM) は、幻覚や浅い推論のため、高い精度のクレーム検証には信頼できないままである。
本稿では, 検証を構造化された, 反対の審議会として再編成する, 裁判所方式のマルチエージェントフレームワーク PROClaim を提案する。
提案手法は,プログレッシブRAG (Progressive RAG, P-RAG) と特別な役割(プレーンティフ, ディフェンス, ジャッジ)を統合し, 議論の間, 証拠プールを動的に拡大・洗練する。
論文 参考訳(メタデータ) (2026-03-30T14:23:15Z) - Preventing the Collapse of Peer Review Requires Verification-First AI [49.995126139461085]
我々は、真理結合、すなわち、過度に科学的真理をトラックする場所のスコアの厳密さを提案する。
プロキシ・ソブリン評価に向けた相転移を駆動する2つの力の形式化を行う。
論文 参考訳(メタデータ) (2026-01-23T17:17:32Z) - Gaming the Judge: Unfaithful Chain-of-Thought Can Undermine Agent Evaluation [76.5533899503582]
大規模言語モデル(LLM)は、エージェントのパフォーマンスを評価するために、ますます裁判官として使われている。
このパラダイムは、エージェントのチェーン・オブ・シークレット(CoT)推論が内部の推論と環境状態の両方を忠実に反映していることを暗黙的に仮定している。
我々は、操作された推論だけで、様々なWebタスクにまたがる800の軌跡に対して、最先端のVLM審査員の偽陽性率を最大90%向上させることができることを実証した。
論文 参考訳(メタデータ) (2026-01-21T06:07:43Z) - FVA-RAG: Falsification-Verification Alignment for Mitigating Sycophantic Hallucinations [0.0]
Falsification-Verification Alignment RAG(FVA-RAG)は、検索パラダイムをインダクティブ・検証(探索支援)からデダクティブ・ファルシフィケーション(耐障害性を参照)へ移行するフレームワークである。
この「アンチ・コンテクスト」に対する草案回答を明示的に重み付けする二重検証機構を導入する。
一般的な誤解のデータセットに関する予備実験では、FVA-RAGは標準的なRAGベースラインと比較して、幻覚に対する堅牢性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2025-12-07T21:28:42Z) - The Missing Parts: Augmenting Fact Verification with Half-Truth Detection [20.011177314734887]
多くの現実世界の主張は半真実であり、実際は正しいが、批判的な文脈が欠落しているために誤解を招く。
我々は,半真実検出の課題を紹介し,文レベルの証拠アライメントと推論されたクレーム意図を付加した15kの政治的クレームを備えた新しいベンチマークであるPolitiFact-Hiddenを提案する。
提案するTRACERは,エビデンスを整理し,インプリートを推定し,隠されたコンテンツの因果的影響を推定することにより,省略に基づく誤報を識別するモジュラー・リアセスメント・フレームワークである。
論文 参考訳(メタデータ) (2025-08-01T10:06:38Z) - CRAVE: A Conflicting Reasoning Approach for Explainable Claim Verification Using LLMs [15.170312674645535]
CRAVE は、説明可能なクレーム VErification に対する Conflicting Reasoning Approach である。
大規模な言語モデルによって推論される矛盾する理性に基づいて、複雑なクレームを検証することができる。
CRAVEは最先端の手法よりもはるかに優れた性能を実現している。
論文 参考訳(メタデータ) (2025-04-21T07:20:31Z) - FIRE: Fact-checking with Iterative Retrieval and Verification [63.67320352038525]
FIREはエビデンス検索とクレーム検証を反復的に統合する新しいフレームワークである。
大きな言語モデル(LLM)のコストを平均7.6倍、検索コストを16.5倍削減しながら、パフォーマンスが若干向上している。
これらの結果から,FIREは大規模ファクトチェック業務における適用を約束していることが明らかとなった。
論文 参考訳(メタデータ) (2024-10-17T06:44:18Z) - Contrastive Learning to Improve Retrieval for Real-world Fact Checking [84.57583869042791]
ファクト・チェッキング・リランカ(Contrastive Fact-Checking Reranker, CFR)を提案する。
我々はAVeriTeCデータセットを活用し、証拠文書からの人間による回答とクレームのサブクエストを注釈付けする。
データセットの精度は6%向上した。
論文 参考訳(メタデータ) (2024-10-07T00:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。