論文の概要: DVAR: Adversarial Multi-Agent Debate for Video Authenticity Detection
- arxiv url: http://arxiv.org/abs/2604.16987v1
- Date: Sat, 18 Apr 2026 13:22:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.275941
- Title: DVAR: Adversarial Multi-Agent Debate for Video Authenticity Detection
- Title(参考訳): DVAR:ビデオ認証検出のための敵対的マルチエージェント議論
- Authors: Hongyuan Qi, Feifei Shao, Ming Li, Hehe Fan, Jun Xiao,
- Abstract要約: 本稿では,ビデオ検出を構造化されたマルチエージェント法定推論プロセスとして再構成する学習自由フレームワークを提案する。
我々はオッカムの『ラザー』を用いて説明コストを定義し、各推論経路の「論理的負担」を定量化する。
我々は、生成境界と障害モードに関する高レベルな推論を提供する動的知識リポジトリであるGenVideoKBを統合する。
- 参考スコア(独自算出の注目度): 32.91820764165758
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid evolution of video generation technologies poses a significant challenge to media forensics, as conventional detection methods often fail to generalize beyond their training distributions. To address this, we propose DVAR (Debate-based Video Authenticity Reasoning), a training-free framework that reformulates video detection as a structured multi-agent forensic reasoning process. Moving beyond the paradigm of pattern matching, DVAR orchestrates a competition between a Generative Hypothesis Agent and a Natural Mechanism Agent. Through iterative rounds of cross-examination, these agents defend their respective explanations against abnormal evidence, driving a logical convergence where the truth emerges from rigorous stress-testing. To adjudicate these conflicting claims, we apply Occam's Razor through the Minimum Description Length (MDL) framework, defining an Explanatory Cost to quantify the "logical burden" of each reasoning path. Furthermore, we integrate GenVideoKB, a dynamic knowledge repository that provides high-level reasoning heuristics on generative boundaries and failure modes. Extensive experiments demonstrate that DVAR achieves competitive performance against supervised state-of-the-art methods while exhibiting superior generalization to unseen generative architectures. By transforming detection into a transparent debate, DVAR provides explicit, interpretable reasoning traces for robust video authenticity assessment.
- Abstract(参考訳): ビデオ生成技術の急速な進化は、従来の検出手法がトレーニング分布を超える一般化に失敗することがしばしばあるため、メディアの法医学にとって大きな課題となる。
そこで我々は,DVAR(Debate-based Video Authenticity Reasoning)を提案する。
パターンマッチングのパラダイムを超えて、DVARは生成仮説エージェントと自然メカニズムエージェントの競合を編成する。
相互検査の反復ラウンドを通じて、これらのエージェントはそれぞれの説明を異常な証拠から守り、真理が厳密なストレステストから現れる論理的収束を導く。
これらの矛盾する主張を代弁するために、我々はオッカムのラザーを最小記述長(MDL)フレームワークを通じて適用し、各推論パスの「論理的負担」を定量化する説明コストを定義する。
さらに、生成境界と障害モードに関する高レベルの推論ヒューリスティックを提供する動的知識リポジトリであるGenVideoKBを統合する。
広汎な実験により、DVARは教師付き最先端手法と競合する性能を示しながら、目に見えない生成アーキテクチャに優れた一般化を示す。
検出を透過的な議論に変換することで、DVARは、堅牢なビデオ認証評価のための明示的で解釈可能な推論トレースを提供する。
関連論文リスト
- Demystifing Video Reasoning [71.53763299316041]
ビデオモデルにおける推論は、主に拡散認知のステップに沿って現れることを示す。
モデル性能に重要ないくつかの創発的推論行動を特定する。
これらの知見に触発され、私たちは概念実証としてトレーニングフリー戦略を提示した。
論文 参考訳(メタデータ) (2026-03-17T17:59:55Z) - VideoVeritas: AI-Generated Video Detection via Perception Pretext Reinforcement Learning [42.22791607763693]
VideoVeritasは、きめ細かい認識と事実に基づく推論のためのフレームワークだ。
共同知覚選好と知覚Pretext Reinforcement Learningが使用される。
論文 参考訳(メタデータ) (2026-02-09T16:00:01Z) - Search-R2: Enhancing Search-Integrated Reasoning via Actor-Refiner Collaboration [49.9937230730202]
本稿では,新たなアクター・リファイナ・コラボレーション・フレームワークであるSearch-R2を提案する。
提案手法は,生成過程をアクターに分解し,最初の推論軌道を生成する。
本稿では,検索-R2がモデルスケール全体にわたって強力なRAGとRLベースのベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-02-03T15:32:09Z) - Adversarial Yet Cooperative: Multi-Perspective Reasoning in Retrieved-Augmented Language Models [72.4149653187766]
本稿ではAdrialversa Reasoning RAG(ARR)というReasoner-Verifierフレームワークを提案する。
ReasonerとVerifierは、回収された証拠を推論し、プロセス認識の利点によってガイドされながら、互いの論理を批判する。
複数のベンチマーク実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2026-01-08T06:57:03Z) - Analyzing Reasoning Consistency in Large Multimodal Models under Cross-Modal Conflicts [74.47786985522762]
テキスト慣性(textual inertia)と呼ばれる重要な障害モードを特定し、矛盾する視覚的証拠を無視しながら、モデルは間違ったテキストに盲目的に固執する傾向がある。
本稿では,多種多様なLMMの推論連鎖に摂動を構造的に注入するLogicGraph摂動プロトコルを提案する。
その結果,10%未満の症例で自己修正が成功し,主に視覚的テキスト誤りの伝播に寄与することが判明した。
論文 参考訳(メタデータ) (2026-01-07T16:39:34Z) - REVEAL: Reasoning-enhanced Forensic Evidence Analysis for Explainable AI-generated Image Detection [30.963994372913092]
我々は、AI生成画像検出のための最初の推論強化マルチモーダルベンチマークである textbfREVEAL-Bench を紹介する。
筆者らのフレームワークは,検出を専門家による新しい強化学習と統合する。
REVEALは検出精度、説明忠実度、堅牢なクロスモデル一般化を著しく向上させる。
論文 参考訳(メタデータ) (2025-11-28T13:11:08Z) - From Evidence to Verdict: An Agent-Based Forensic Framework for AI-Generated Image Detection [19.240335260177382]
AIFo(Agent-based Image Forensics)は、マルチエージェントコラボレーションによる人間の法医学的調査をエミュレートする、トレーニング不要のフレームワークである。
従来の手法とは異なり,本フレームワークでは,リバース画像検索,メタデータ抽出,事前学習型分類器,VLM解析など,一連の法医学的ツールを用いている。
我々の総合的な評価は6000のイメージに及び、現代の生成プラットフォームや多様なオンラインソースの画像を含む現実世界のシナリオに挑戦する。
論文 参考訳(メタデータ) (2025-10-31T18:36:49Z) - VAR: Visual Attention Reasoning via Structured Search and Backtracking [49.427842994857635]
構造化された検索としてグラウンドド推論をリキャストするフレームワークであるVisual Attention Reasoningを紹介する。
VARは、推論プロセスを2つの重要な段階に分解する。
我々は、我々の7BモデルであるVAR-7Bが、幻覚と安全性のベンチマークの包括的なスイートに新しい最先端を設定していることを示します。
論文 参考訳(メタデータ) (2025-10-21T13:18:44Z) - Unlocking Vision-Language Models for Video Anomaly Detection via Fine-Grained Prompting [17.850029260662648]
本稿では,ビデオ異常検出のための構造化プロンプトフレームワークであるASK-Hintを提案する。
提案手法は, セマンティック・コヒーレントなグループにプロンプトを整理し, きめ細かい案内質問を定式化する。
UCF-CrimeとXD-Violenceの実験では、ASK-Hintは以前のベースラインよりも一貫してAUCを改善している。
論文 参考訳(メタデータ) (2025-10-02T16:06:31Z) - ThinkFake: Reasoning in Multimodal Large Language Models for AI-Generated Image Detection [51.93101033997245]
AI生成画像のリアリズムの増大は、誤情報やプライバシー侵害に対する深刻な懸念を引き起こしている。
我々は、AI生成画像検出のための新しい推論に基づく一般化可能なフレームワークThinkFakeを提案する。
我々は、ThinkFakeがGenImageベンチマークで最先端の手法より優れており、挑戦的なLOKIベンチマークで強力なゼロショットの一般化を示すことを示す。
論文 参考訳(メタデータ) (2025-09-24T07:34:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。