論文の概要: RW-Post: Auditable Evidence-Grounded Multimodal Fact-Checking in the Wild
- arxiv url: http://arxiv.org/abs/2605.10357v2
- Date: Tue, 12 May 2026 03:18:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 18:21:07.123371
- Title: RW-Post: Auditable Evidence-Grounded Multimodal Fact-Checking in the Wild
- Title(参考訳): RW-Post: 野生でのマルチモーダル・ファクト・チェッキング
- Authors: Danni Xu, Shaojing Fan, Harry Cheng, Mohan Kankanhalli,
- Abstract要約: RW-Postは、実世界のマルチモーダルなファクトチェックのための、ポストアラインなtextbftext-imageベンチマークである。
RW-Postは、クローズドブック、エビデンスバウンド、オープンウェブレジーム間の制御評価をサポートする。
- 参考スコア(独自算出の注目度): 9.55806677152407
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal misinformation increasingly leverages visual persuasion, where repurposed or manipulated images strengthen misleading text. We introduce \textbf{RW-Post}, a post-aligned \textbf{text--image benchmark} for real-world multimodal fact-checking with \emph{auditable} annotations: each instance links the original social-media post with reasoning traces and explicitly linked evidence items derived from human fact-check articles via an LLM-assisted extraction-and-auditing pipeline. RW-Post supports controlled evaluation across closed-book, evidence-bounded, and open-web regimes, enabling systematic diagnosis of visual grounding and evidence utilization. We provide \textbf{AgentFact} as a reference verification baseline and benchmark strong open-source LVLMs under unified protocols. Experiments show substantial headroom: current models struggle with faithful evidence grounding, while evidence-bounded evaluation improves both accuracy and faithfulness. Code and dataset will be released at https://github.com/xudanni0927/AgentFact.
- Abstract(参考訳): マルチモーダルな誤報は、画像の再使用や操作によって誤解を招くテキストが強化される、視覚的説得をますます活用する。
実世界のマルチモーダルなファクトチェックと \emph{auditable} アノテーションを併用したポストアライメントの \textbf{RW-Post} を紹介した。
RW-Postは、クローズドブック、エビデンスバウンド、オープンウェブレジーム間の制御された評価をサポートし、視覚的根拠の体系的診断とエビデンス利用を可能にする。
参照検証ベースラインとして \textbf{AgentFact} を提供し、統一プロトコルの下で強力なオープンソース LVLM をベンチマークする。
現在のモデルは忠実な証拠に苦しむ一方、証拠に縛られた評価は正確さと忠実さの両方を改善する。
コードとデータセットはhttps://github.com/xudanni0927/AgentFact.orgで公開される。
関連論文リスト
- Align Documents to Questions: Question-Oriented Document Rewriting for Retrieval-Augmented Generation [51.55755193937205]
提案するQREAMは,検索した文書を事実を保存しながら質問指向のスタイルで整列するスタイル制御リライタである。
本フレームワークは,(1) 反復的書き換え探索にスタイリスティックシードを用いたQREAM-ICL,(2) ICL出力から抽出した軽量学生モデルQREAM-FTの2段階からなる。
論文 参考訳(メタデータ) (2026-04-19T08:39:21Z) - Is a Picture Worth a Thousand Words? Adaptive Multimodal Fact-Checking with Visual Evidence Necessity [7.793738133162104]
AMuFCは、視覚的エビデンスを適応的に利用するために2つの協調エージェントを使用するマルチモーダルなファクトチェックフレームワークである。
解析器の視覚的エビデンス評価を検証器の予測に組み込むことで,検証性能が大幅に向上することを示す。
すべてのコードに加えて、より現実的なシナリオでファクトチェックモジュールを評価するために新たに構築されたデータセットであるWebFCもリリースします。
論文 参考訳(メタデータ) (2026-04-06T14:01:38Z) - Multi-Sourced, Multi-Agent Evidence Retrieval for Fact-Checking [47.47518672198846]
インターネット上に拡散する誤報は、社会と個人の両方に重大な脅威をもたらす。
これまでの方法は、トレーニングデータから学んだ意味的パターンと社会的コンテキスト的パターンに依存していた。
我々は、証拠のコアリソースとして認証されたオープンナレッジグラフを利用するWKGFCを提案する。
論文 参考訳(メタデータ) (2026-02-27T19:29:01Z) - CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era [51.63024682584688]
大規模言語モデル (LLM) は新たなリスクを導入している。
本稿では,科学文献における幻覚的引用のための総合的なベンチマークおよび検出フレームワークについて紹介する。
我々のフレームワークは、精度と解釈可能性の両方において、先行手法を著しく上回っている。
論文 参考訳(メタデータ) (2026-02-26T19:17:39Z) - Look As You Think: Unifying Reasoning and Visual Evidence Attribution for Verifiable Document RAG via Reinforcement Learning [55.232400251303794]
Look As You Think (LAT)は、モデルをトレーニングし、一貫した帰属性を持った検証可能な推論パスを生成するための強化学習フレームワークである。
LATはシングルイメージとマルチイメージの両方でバニラモデルを一貫して改善し、平均ゲインは8.23%、IoU@0.5では47.0%となる。
論文 参考訳(メタデータ) (2025-11-15T02:50:23Z) - Unstructured Evidence Attribution for Long Context Query Focused Summarization [53.08341620504465]
固定粒度の場合よりも、より関連性が高く一貫した証拠を得るために、非構造的(すなわち任意の長さのスパン)な証拠を抽出することを提案する。
既存のシステムが、非構造的証拠をコピーし、適切に引用するのにどのように苦労しているかを示す。
論文 参考訳(メタデータ) (2025-02-20T09:57:42Z) - DEFAME: Dynamic Evidence-based FAct-checking with Multimodal Experts [35.952854524873246]
Dynamic Evidence-based FAct-checking with Multimodal Experts (DEFAME)は、オープンドメイン、テキストイメージクレーム検証のためのゼロショットMLLMパイプラインである。
DEFAMEは6段階のプロセスで動作し、ツールと検索深度を動的に選択し、テキストおよび視覚的証拠を抽出し、評価する。
論文 参考訳(メタデータ) (2024-12-13T19:11:18Z) - Give Me More Details: Improving Fact-Checking with Latent Retrieval [58.706972228039604]
証拠は、自動化された事実チェックにおいて重要な役割を果たす。
既存のファクトチェックシステムは、エビデンス文が与えられたと仮定するか、検索エンジンが返した検索スニペットを使用する。
資料から得られた全文を証拠として組み込んで,2つの豊富なデータセットを導入することを提案する。
論文 参考訳(メタデータ) (2023-05-25T15:01:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。