論文の概要: VRAG-DFD: Verifiable Retrieval-Augmentation for MLLM-based Deepfake Detection
- arxiv url: http://arxiv.org/abs/2604.13660v1
- Date: Wed, 15 Apr 2026 09:27:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.46851
- Title: VRAG-DFD: Verifiable Retrieval-Augmentation for MLLM-based Deepfake Detection
- Title(参考訳): VRAG-DFD:MLLMに基づくディープフェイク検出のための検証可能な検索拡張
- Authors: Hui Han, Shunli Wang, Yandan Zhao, Taiping Yao, Shouhong Ding,
- Abstract要約: 本稿では,正確な動的偽情報検索と強力なクリティカル推論機能を備えたVRAG-DFDフレームワークを提案する。
データに関しては、DFD知識アノテーションのためのForensic Knowledge Database(FKD)と、重要なCoT構築のためのForensic Chain-of-Thoughtデータセット(F-CoT)の2つのデータセットを構築した。
性能面では、VRAG-DFD は SOTA と DFD の一般化テストにおける競合性能を達成した。
- 参考スコア(独自算出の注目度): 49.88962095967614
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In Deepfake Detection (DFD) tasks, researchers proposed two types of MLLM-based methods: complementary combination with small DFD detectors, or static forgery knowledge injection.The lack of professional forgery knowledge hinders the performance of these DFD-MLLMs.To solve this, we deeply considered two insightful issues: How to provide high-quality associated forgery knowledge for MLLMs? AND How to endow MLLMs with critical reasoning abilities given noisy reference information? Notably, we attempted to address above two questions with preliminary answers by leveraging the combination of Retrieval-Augmented Generation (RAG) and Reinforcement Learning (RL).Through RAG and RL techniques, we propose the VRAG-DFD framework with accurate dynamic forgery knowledge retrieval and powerful critical reasoning capabilities.Specifically, in terms of data, we constructed two datasets with RAG: Forensic Knowledge Database (FKD) for DFD knowledge annotation, and Forensic Chain-of-Thought Dataset (F-CoT), for critical CoT construction.In terms of model training, we adopt a three-stage training method (Alignment->SFT->GRPO) to gradually cultivate the critical reasoning ability of the MLLM.In terms of performance, VRAG-DFD achieved SOTA and competitive performance on DFD generalization testing.
- Abstract(参考訳): Deepfake Detection(DFD)タスクでは、小さなDFD検出器と補完的な組み合わせや静的偽造知識注入という2種類のMLLMベースの手法が提案されている。
騒音参照情報を用いた批判的推論能力を有するMLLMの活用法
特に,検索・強化生成(RAG)と強化学習(Reinforcement Learning, RL)を組み合わせることで,予備的な回答を得られた2つの質問に対処しようとした。
RAG と RL の手法により,正確な動的偽造知識検索と強力な臨界推論能力を備えた VRAG-DFD フレームワークを提案する。特にデータの観点からは,DFD 知識アノテーションのための Forensic Knowledge Database (FKD) と重要な CoT 構築のための Forensic Chain-of-Thought Dataset (F-CoT) という2つのデータセットを構築した。モデルトレーニングでは,3段階のトレーニング手法 (Alignment->SFT->GRPO) を採用し,MLLM の臨界推論能力を徐々に育成する。
関連論文リスト
- Code-in-the-Loop Forensics: Agentic Tool Use for Image Forgery Detection [59.04089915447622]
ForenAgentはインタラクティブなIFDフレームワークで、MLLMが検出対象に関するPythonベースの低レベルツールを自律的に生成、実行、洗練することができる。
人間の推論にインスパイアされた我々は、グローバルな認識、局所的な焦点、反復的探索、そして全体論的偏見を含む動的推論ループを設計する。
実験の結果,ForenAgent は IFD 課題に対する創発的なツール利用能力と反射的推論を示すことがわかった。
論文 参考訳(メタデータ) (2025-12-18T08:38:44Z) - DMRL: Data- and Model-aware Reward Learning for Data Extraction [3.511535517476954]
大規模言語モデル(LLM)は本質的に意図しないプライバシー侵害に対して脆弱である。
本稿では,データ抽出のためのデータ・モデル・アウェア・リワード学習手法を提案する。
論文 参考訳(メタデータ) (2025-05-07T07:21:37Z) - Unlocking the Capabilities of Large Vision-Language Models for Generalizable and Explainable Deepfake Detection [18.125287697902813]
現在のLVLM(Large Vision-Language Models)は、マルチモーダルデータの理解において顕著な能力を示している。
深度検出のためのLVLMの潜在能力を解き放つ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-19T03:20:03Z) - Towards Interactive Deepfake Analysis [40.0271474912034]
本稿では,マルチモーダル大言語モデル(MLLM)の命令チューニングによる対話型ディープフェイク解析の探索を目的とする。
これらの課題に対処するために,(1)DFA-Instructと呼ばれるインストラクションフォローデータセットを実現するGPT支援データ構築プロセス,(2)DFA-Benchというベンチマーク,(3)DFA-GPTと呼ばれる対話型ディープフェイク分析システムをコミュニティの強力なベースラインとして構築する深度検出・深度分類・アーティファクト記述におけるMLLMの能力を包括的に評価することを目的とした,DFA-Benchというベンチマークを導入する。
論文 参考訳(メタデータ) (2025-01-02T09:34:11Z) - FD-LLM: Large Language Model for Fault Diagnosis of Machines [20.679299204776527]
本研究では,時系列センサデータから故障を識別するための数値データ入力に,大規模言語モデルを効果的に適用した新しいIFD手法を提案する。
マルチクラス分類問題としてLLMのトレーニングを定式化することにより,故障診断に特化して設計されたLLMフレームワークであるFD-LLMを提案する。
FD-LLM フレームワークに基づく4つのオープンソース LLM の故障診断能力を評価し,各種動作条件下でのモデルの適応性と一般化性を評価する。
論文 参考訳(メタデータ) (2024-12-02T07:36:35Z) - X2-DFD: A framework for eXplainable and eXtendable Deepfake Detection [55.77552681618732]
X2-DFDは、eXplainableおよびeXtendableフレームワークであり、ディープフェイク検出のためのマルチモーダルな多言語モデル(MLLM)に基づいている。
最初の段階であるモデル特徴評価は、MLLMの偽造関係の特徴の検出可能性を体系的に評価する。
2番目のステージであるExplainable dataset Constructionは、Strong Feature StrengtheningとWeak Feature Supplementingの2つの重要なモジュールで構成されている。
3番目のステージであるファインチューニングと推論では、構築されたデータセット上でMLLMを微調整し、最終的な検出と説明のためにデプロイする。
論文 参考訳(メタデータ) (2024-10-08T15:28:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。