論文の概要: Divide and Conquer: Reliable Multi-View Evidential Learning for Deepfake Detection
- arxiv url: http://arxiv.org/abs/2606.01885v1
- Date: Mon, 01 Jun 2026 08:29:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.614187
- Title: Divide and Conquer: Reliable Multi-View Evidential Learning for Deepfake Detection
- Title(参考訳): ディバイドとコンカー:ディープフェイク検出のための信頼性の高いマルチビュー・エビデンシャル・ラーニング
- Authors: Xiaolu Kang, Zhongyuan Wang, Jikang Cheng, Baojin Huang, Zhanhe Lei, Gang Wu, Qin Zou, Qian Wang,
- Abstract要約: ディープフェイクはセマンティック・リアリズムをほぼ完璧に達成し、法医学的な痕跡は微妙な構造上の異常にのみ残されている。
既存の単一ビューのパラダイムは、支配的なセマンティックな特徴が微妙なアーティファクトの手がかりを圧倒するため、しばしば一般化に失敗する。
本稿では,ディープフェイク検出のためのDivide-and-Conquer Multi-View Evidential Learning (DiCoME)を提案する。
- 参考スコア(独自算出の注目度): 20.81268820480393
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the evolution of generative models, deepfakes have achieved near-perfect semantic realism, leaving forensic traces only in subtle structural anomalies. However, existing single-view paradigms often fail to generalize, as dominant semantic features overwhelm subtle artifact cues within entangled representations. This imbalance leads to overconfident yet brittle predictions -- a phenomenon we term the Semantic Masking Effect. To address this challenge, we propose a reliable framework called Divide-and-Conquer Multi-View Evidential Learning (DiCoME) for Deepfake Detection. In the "Divide" phase, we employ Geometric View Purification to decompose the entangled representation space through principled geometric projection. This process suppresses semantic interference within artifact-sensitive representations, forming the foundation for decorrelated yet complementary semantic and artifact views. In the "Conquer" phase, we leverage Uncertainty-Aware Evidential Learning to synthesize these distinct views. By explicitly modeling the "epistemic conflict" between semantic and artifact cues, this mechanism provides calibrated uncertainty estimates instead of forcing rigid deterministic decisions. Extensive experiments across multiple benchmarks demonstrate that our method consistently outperforms existing approaches in generalization performance, while providing reliable uncertainty estimation for trustworthy deepfake detection. Code is available at https://github.com/kxl0825/DiCoME.git.
- Abstract(参考訳): 生成モデルの進化により、ディープフェイクはほぼ完璧なセマンティックリアリズムを達成し、法医学的痕跡は微妙な構造的異常にのみ残されている。
しかし、既存の単一ビューのパラダイムは、支配的なセマンティックな特徴が絡み合った表現の中で微妙なアーティファクトの手がかりを圧倒するため、しばしば一般化に失敗する。
この不均衡は、過信だが不安定な予測へとつながり、これはセマンティック・マスキング・エフェクト(Semantic Masking Effect)と呼ばれる現象である。
この課題に対処するため,ディープフェイク検出のためのDivide-and-Conquer Multi-View Evidential Learning (DiCoME) という信頼性の高いフレームワークを提案する。
ディヴィッド」相では、幾何学的ビューパーフィケーションを用いて、原理化された幾何学的射影を通して絡み合った表現空間を分解する。
このプロセスは、人工物に敏感な表現における意味的干渉を抑制し、非相関であるが相補的な意味的・人工的なビューの基礎を形成する。
In the "Conquer" phase, we leverage Uncertainty-Aware Evidential Learning to synthesis these different view。
このメカニズムは意味論とアーティファクトの「緊急衝突」を明示的にモデル化することで、厳密な決定論的な決定を強制するのではなく、キャリブレーションされた不確実性の推定を提供する。
複数のベンチマークを対象とした実験により,提案手法は信頼性の高い深度検出のための信頼性の高い不確実性評価を提供しながら,従来手法よりも常に優れた一般化性能を示すことが示された。
コードはhttps://github.com/kxl0825/DiCoME.gitで入手できる。
関連論文リスト
- Hierarchical Consistency Learning for Test-time Adaptation in Camouflage Perception [50.278200968044665]
カモフラージュされた物体検出(COD)は、物理的属性を通して背景から最小限の知覚差を示すターゲットをローカライズすることを目的としている。
既存のメソッドは、静的なTrain-then-freezeパラダイムによって制約されており、ドメインの剛性と依存性のアノテーションに悩まされている。
動的表現再構成のためのテスト時間適応を統合した階層的一貫性学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-25T09:57:46Z) - AIFIND: Artifact-Aware Interpreting Fine-Grained Alignment for Incremental Face Forgery Detection [23.80607349547519]
AIFIND, Artifact-Aware Interpreting Fine-Grained Alignment for Incremental Face Forgery Detectionを提案する。
セマンティックアンカーを使用して、漸進的な学習を安定化します。
論文 参考訳(メタデータ) (2026-04-17T16:17:12Z) - Beyond Surface Artifacts: Capturing Shared Latent Forgery Knowledge Across Modalities [52.189426539304065]
本稿では,従来の「機能融合」から「モダリティ一般化」に再定義するパラダイムシフトを提案する。
モーダリティ固有のスタイルを明示的に分離することにより,MAFは必須かつ非モーダルな潜在フォージェリー知識を正確に抽出する。
論文 参考訳(メタデータ) (2026-04-09T03:35:21Z) - Verify when Uncertain: Beyond Self-Consistency in Black Box Hallucination Detection [25.176984317213858]
大型言語モデル(LLM)は幻覚に悩まされ、センシティブなアプリケーションにおける信頼性を損なう。
本稿では,検証モデルを一部のケースに対してのみ呼び出す,予算に優しい2段階検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-20T21:06:08Z) - Uncertainty Quantification via Hölder Divergence for Multi-View Representation Learning [18.076966572539547]
本稿では,H"older Divergence (HD)に基づく新しいアルゴリズムを導入し,多視点学習の信頼性を高める。
デンプスター・シェーファー理論を通じて、異なるモダリティからの不確実性の統合により、包括的な結果が生成される。
数学的には、HDは実際のデータ分布とモデルの予測分布の間の距離'をよりよく測定できることを証明している。
論文 参考訳(メタデータ) (2024-10-29T04:29:44Z) - Unearthing Common Inconsistency for Generalisable Deepfake Detection [8.327980745153216]
ビデオレベル1は、複数のドメインにまたがる一般化と圧縮に対する堅牢性の両方を持つ可能性を示している。
本稿では,異なる偽造技術に広く存在するフレーム不整合を捉えることによって検出手法を提案する。
本研究では,時間的に保存されたモジュール法を導入し,空間雑音の摂動を導入し,時間的情報に対するモデルの注意を向ける。
論文 参考訳(メタデータ) (2023-11-20T06:04:09Z) - ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object Detection [70.11264880907652]
最近のオブジェクト(COD)は、現実のシナリオでは極めて複雑で難しい、視覚的にブレンドされたオブジェクトを周囲に分割しようと試みている。
本研究では,不明瞭な画像を観察したり,ズームインしたりアウトしたりする際の人間の行動を模倣する,効果的な統合協調ピラミッドネットワークを提案する。
我々のフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2023-10-31T06:11:23Z) - COMICS: End-to-end Bi-grained Contrastive Learning for Multi-face Forgery Detection [56.7599217711363]
顔偽造認識法は一度に1つの顔しか処理できない。
ほとんどの顔偽造認識法は一度に1つの顔しか処理できない。
マルチフェイスフォージェリ検出のためのエンドツーエンドフレームワークであるCOMICSを提案する。
論文 参考訳(メタデータ) (2023-08-03T03:37:13Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。