論文の概要: Phase4DFD: Multi-Domain Phase-Aware Attention for Deepfake Detection
- arxiv url: http://arxiv.org/abs/2601.05861v1
- Date: Fri, 09 Jan 2026 15:37:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:50.010326
- Title: Phase4DFD: Multi-Domain Phase-Aware Attention for Deepfake Detection
- Title(参考訳): フェーズ4DFD:ディープフェイク検出のためのマルチドメインフェイズアウェアアテンション
- Authors: Zhen-Xin Lin, Shang-Kuan Chen,
- Abstract要約: 本稿では,位相差の相互作用を明示的にモデル化する位相対応周波数領域ディープフェイク検出フレームワークを提案する。
提案手法は,Fast Fourier Transform (FFT) とLocal binary pattern (LBP) を用いて標準RGB入力を拡張し,微妙な合成アーティファクトを露呈する。
CIFAKEとDFFDのデータセットを用いた実験により,提案したフェーズ4DFDは,芸術空間および周波数に基づく検出器の状態よりも優れていた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent deepfake detection methods have increasingly explored frequency domain representations to reveal manipulation artifacts that are difficult to detect in the spatial domain. However, most existing approaches rely primarily on spectral magnitude, implicitly under exploring the role of phase information. In this work, we propose Phase4DFD, a phase aware frequency domain deepfake detection framework that explicitly models phase magnitude interactions via a learnable attention mechanism. Our approach augments standard RGB input with Fast Fourier Transform (FFT) magnitude and local binary pattern (LBP) representations to expose subtle synthesis artifacts that remain indistinguishable under spatial analysis alone. Crucially, we introduce an input level phase aware attention module that uses phase discontinuities commonly introduced by synthetic generation to guide the model toward frequency patterns that are most indicative of manipulation before backbone feature extraction. The attended multi domain representation is processed by an efficient BNext M backbone, with optional channel spatial attention applied for semantic feature refinement. Extensive experiments on the CIFAKE and DFFD datasets demonstrate that our proposed model Phase4DFD outperforms state of the art spatial and frequency-based detectors while maintaining low computational overhead. Comprehensive ablation studies further confirm that explicit phase modeling provides complementary and non-redundant information beyond magnitude-only frequency representations.
- Abstract(参考訳): 近年のディープフェイク検出手法では,空間領域において検出が困難である人工物を明らかにするために周波数領域表現の探索が進んでいる。
しかし、既存のアプローチのほとんどは主にスペクトル等級に依存しており、位相情報の役割を暗黙的に探求している。
本研究では,位相対応周波数領域深度検出フレームワークであるフェーズ4DFDを提案する。
提案手法は,Fast Fourier Transform (FFT) とローカルバイナリパターン (LBP) を用いて標準RGB入力を拡張し,空間解析のみでは識別できない微妙な合成人工物を明らかにする。
重要なことは、入力レベル位相認識注意モジュールを導入し、合成生成によって一般的に導入される位相不連続を利用して、バックボーン特徴抽出前の操作を最も示唆する周波数パターンを導出する。
参加するマルチドメイン表現は、効率の良いBNext Mバックボーンで処理され、任意のチャネル空間の注意が意味的特徴の洗練に適用される。
CIFAKEとDFFDデータセットの大規模な実験により、提案したフェーズ4DFDは、計算オーバーヘッドを低く保ちながら、最先端の空間および周波数に基づく検出器より優れていることが示された。
包括的アブレーション研究により、明示的な位相モデリングは、等級のみの周波数表現を超える相補的かつ非冗長な情報を提供することが明らかになった。
関連論文リスト
- WaveSeg: Enhancing Segmentation Precision via High-Frequency Prior and Mamba-Driven Spectrum Decomposition [61.3530659856013]
本稿では,空間およびウェーブレット領域の機能改善を共同で最適化する新しいデコーダアーキテクチャであるWaveSegを提案する。
高周波成分は、まず入力画像から、境界の詳細を強化するために明示的な先行として学習される。
標準ベンチマークの実験では、Mambaベースの注目に先立ってウェーブレット-ドメイン周波数を利用するWaveSegが、常に最先端のアプローチより優れていることが示されている。
論文 参考訳(メタデータ) (2025-10-24T01:41:31Z) - A Spatial-Spectral-Frequency Interactive Network for Multimodal Remote Sensing Classification [45.80836671298513]
本稿では,空間,スペクトル,周波数領域にまたがる相互融合モジュールを統合した空間-スペクトル-周波数相互作用ネットワーク(S$2$Fin)を提案する。
ラベル付きデータに制限のある4つのベンチマークマルチモーダルデータセットの実験は、S$2$Finが優れた分類を行い、最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2025-10-06T09:33:35Z) - Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文 参考訳(メタデータ) (2025-08-07T11:14:16Z) - Frequency Domain-Based Diffusion Model for Unpaired Image Dehazing [92.61216319417208]
そこで本稿では,未確認データにおける有益な知識を十分に活用するための,新しい周波数領域ベース拡散モデルを提案する。
拡散モデル(DM)が示す強い生成能力に着想を得て,周波数領域再構成の観点からデハージング課題に取り組む。
論文 参考訳(メタデータ) (2025-07-02T01:22:46Z) - Towards Generalizable Deepfake Detection with Spatial-Frequency Collaborative Learning and Hierarchical Cross-Modal Fusion [3.9408262382784236]
本稿では,マルチスケール空間周波数解析を統合した新しいフレームワークを提案する。
本手法は精度と一般化性の両方で最先端のディープフェイク検出法より優れる。
論文 参考訳(メタデータ) (2025-04-24T03:23:35Z) - Detecting Audio-Visual Deepfakes with Fine-Grained Inconsistencies [11.671275975119089]
空間領域と時間領域の両方において微妙なアーティファクトを検出するためのきめ細かいメカニズムを提案する。
まず,音声との不整合が生じやすい小さな空間領域を撮影できる局所視覚モデルを提案する。
第2に、トレーニングセットに微妙な時間的不整合を取り入れたサンプルを含む、時間的に局所的な擬似フェイク増強を導入する。
論文 参考訳(メタデータ) (2024-08-13T09:19:59Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Transform Once: Efficient Operator Learning in Frequency Domain [69.74509540521397]
本研究では、周波数領域の構造を利用して、空間や時間における長距離相関を効率的に学習するために設計されたディープニューラルネットワークについて検討する。
この研究は、単一変換による周波数領域学習のための青写真を導入している。
論文 参考訳(メタデータ) (2022-11-26T01:56:05Z) - Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in
Frequency Domain [88.7339322596758]
本論文では,空間画像と位相スペクトルを組み合わせ,顔の偽造のアップサンプリング成果をキャプチャするSPSL(Spatial-Phase Shallow Learning)法を提案する。
SPSLは、クロスデータセット評価における最先端性能とマルチクラス分類を実現し、単一データセット評価において同等の結果を得ることができる。
論文 参考訳(メタデータ) (2021-03-02T16:45:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。