論文の概要: Multimodal Fact-Checking: An Agent-based Approach
- arxiv url: http://arxiv.org/abs/2512.22933v3
- Date: Sun, 04 Jan 2026 06:59:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 14:31:43.649235
- Title: Multimodal Fact-Checking: An Agent-based Approach
- Title(参考訳): マルチモーダルFact-Checking:エージェントによるアプローチ
- Authors: Danni Xu, Shaojing Fan, Harry Cheng, Mohan Kankanhalli,
- Abstract要約: 実世界のマルチモーダルファクトチェックのための高品質で説明可能なデータセットであるRW-Postを紹介する。
RW-Postは、実世界のマルチモーダルなクレームと、そのクレームが作成されるリッチなコンテキスト情報を保存するオリジナルのソーシャルメディア投稿を整合させる。
RW-PostをベースとしたエージェントベースのマルチモーダルファクトチェックフレームワークであるAgentFactを提案する。
- 参考スコア(独自算出の注目度): 9.55806677152407
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid spread of multimodal misinformation poses a growing challenge for automated fact-checking systems. Existing approaches, including large vision language models (LVLMs) and deep multimodal fusion methods, often fall short due to limited reasoning and shallow evidence utilization. A key bottleneck is the lack of dedicated datasets that provide complete real-world multimodal misinformation instances accompanied by annotated reasoning processes and verifiable evidence. To address this limitation, we introduce RW-Post, a high-quality and explainable dataset for real-world multimodal fact-checking. RW-Post aligns real-world multimodal claims with their original social media posts, preserving the rich contextual information in which the claims are made. In addition, the dataset includes detailed reasoning and explicitly linked evidence, which are derived from human written fact-checking articles via a large language model assisted extraction pipeline, enabling comprehensive verification and explanation. Building upon RW-Post, we propose AgentFact, an agent-based multimodal fact-checking framework designed to emulate the human verification workflow. AgentFact consists of five specialized agents that collaboratively handle key fact-checking subtasks, including strategy planning, high-quality evidence retrieval, visual analysis, reasoning, and explanation generation. These agents are orchestrated through an iterative workflow that alternates between evidence searching and task-aware evidence filtering and reasoning, facilitating strategic decision-making and systematic evidence analysis. Extensive experimental results demonstrate that the synergy between RW-Post and AgentFact substantially improves both the accuracy and interpretability of multimodal fact-checking.
- Abstract(参考訳): マルチモーダルな誤報の急速な拡散は、自動化された事実チェックシステムにとって、ますます難しい課題となっている。
大規模視覚言語モデル(LVLM)や深層多モード融合法といった既存のアプローチは、限られた推論と浅い証拠利用のためにしばしば不足する。
重要なボトルネックは、注釈付き推論プロセスと検証可能な証拠を伴って、完全な実世界のマルチモーダルな誤報事例を提供する専用のデータセットがないことである。
この制限に対処するため,実世界のマルチモーダルファクトチェックのための高品質で説明可能なデータセットであるRW-Postを紹介した。
RW-Postは、実世界のマルチモーダルなクレームと、そのクレームが作成されるリッチなコンテキスト情報を保存するオリジナルのソーシャルメディア投稿を整合させる。
さらに、データセットには詳細な推論と明示的にリンクされたエビデンスが含まれており、これは人間の記述した事実チェック記事から、大規模な言語モデル支援抽出パイプラインを通じて導き出されたもので、包括的な検証と説明を可能にする。
RW-PostをベースとしたエージェントベースのマルチモーダルファクトチェックフレームワークであるAgentFactを提案する。
AgentFactは、戦略計画、高品質な証拠検索、視覚分析、推論、説明生成など、重要な事実チェックサブタスクを協調的に扱う5つの専門エージェントで構成されている。
これらのエージェントは、エビデンス検索とタスク認識エビデンスフィルタリングと推論を交互に交互に行い、戦略的意思決定とシステマティックエビデンス分析を促進する。
RW-PostとAgentFactの相乗効果は,マルチモーダルなファクトチェックの精度と解釈性を大幅に向上させることを示した。
関連論文リスト
- Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.36285696607487]
文書理解は、財務分析から科学的発見への応用に不可欠である。
現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。
Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文 参考訳(メタデータ) (2025-10-17T02:33:16Z) - DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。
我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文 参考訳(メタデータ) (2025-07-29T17:55:23Z) - RAMA: Retrieval-Augmented Multi-Agent Framework for Misinformation Detection in Multimodal Fact-Checking [15.160356035522609]
RAMAは、マルチメディアの誤情報を検証するために設計された新しい検索拡張マルチエージェントフレームワークである。
RAMAには,(1)マルチモーダルクレームを正確なWeb検索クエリに変換する戦略的クエリの定式化,(2)多様な権威ソースからの相互検証証拠の集約,(3)マルチエージェントアンサンブルアーキテクチャの3つの革新が含まれている。
論文 参考訳(メタデータ) (2025-07-12T07:46:51Z) - Towards Robust Fact-Checking: A Multi-Agent System with Advanced Evidence Retrieval [1.515687944002438]
デジタル時代における誤報の急速な拡散は、世論に重大な課題をもたらす。
従来の人間主導のファクトチェック手法は信頼できるが、オンラインコンテンツの量と速度に苦慮している。
本稿では, 精度, 効率, 説明性を向上する自動ファクトチェックのための新しいマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2025-06-22T02:39:27Z) - Benchmarking Retrieval-Augmented Multimodal Generation for Document Question Answering [60.062194349648195]
Document Visual Question Answering (DocVQA)は、長いマルチモーダル文書の処理において2つの課題に直面している。
現在の文書検索拡張生成法(DocRAG)はテキスト中心のアプローチによって制限されている。
MMDocRAGは,多ページのクロスモーダルエビデンスチェーンを持つ4,055のエキスパートアノテーション付きQAペアを特徴とする総合ベンチマークである。
論文 参考訳(メタデータ) (2025-05-22T09:52:57Z) - Progressive Multimodal Reasoning via Active Retrieval [64.74746997923967]
多段階多モーダル推論タスクは、大規模言語モデル(MLLM)に重大な課題をもたらす
本稿では,MLLMの推論能力の向上を目的とした汎用フレームワークAR-MCTSを提案する。
我々は,AR-MCTSがサンプリングの多様性と精度を最適化し,信頼性の高いマルチモーダル推論を実現することを示す。
論文 参考訳(メタデータ) (2024-12-19T13:25:39Z) - Towards Rationality in Language and Multimodal Agents: A Survey [23.451887560567602]
この研究は、より合理的な言語とマルチモーダルエージェントを構築する方法について議論する。
合理性は理性によって導かれる性質であり、証拠や論理原理と整合した意思決定によって特徴づけられる。
論文 参考訳(メタデータ) (2024-06-01T01:17:25Z) - Multimodal Large Language Models to Support Real-World Fact-Checking [80.41047725487645]
MLLM(Multimodal large language model)は、膨大な情報処理において人間を支援する能力を持つ。
MLLMはすでにファクトチェックツールとして使用されていますが、その能力や制限については検討中です。
本稿では,現実のファクトチェックを容易にするために,現在のマルチモーダルモデルの能力を体系的に評価するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-06T11:32:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。