論文の概要: Generalizing Face Forgery Detection with High-frequency Features
- arxiv url: http://arxiv.org/abs/2103.12376v1
- Date: Tue, 23 Mar 2021 08:19:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-25 00:15:12.613456
- Title: Generalizing Face Forgery Detection with High-frequency Features
- Title(参考訳): 高周波特徴を用いた顔偽造検出の一般化
- Authors: Yuchen Luo, Yong Zhang, Junchi Yan, Wei Liu
- Abstract要約: 現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
- 参考スコア(独自算出の注目度): 63.33397573649408
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current face forgery detection methods achieve high accuracy under the
within-database scenario where training and testing forgeries are synthesized
by the same algorithm. However, few of them gain satisfying performance under
the cross-database scenario where training and testing forgeries are
synthesized by different algorithms. In this paper, we find that current
CNN-based detectors tend to overfit to method-specific color textures and thus
fail to generalize. Observing that image noises remove color textures and
expose discrepancies between authentic and tampered regions, we propose to
utilize the high-frequency noises for face forgery detection. We carefully
devise three functional modules to take full advantage of the high-frequency
features. The first is the multi-scale high-frequency feature extraction module
that extracts high-frequency noises at multiple scales and composes a novel
modality. The second is the residual-guided spatial attention module that
guides the low-level RGB feature extractor to concentrate more on forgery
traces from a new perspective. The last is the cross-modality attention module
that leverages the correlation between the two complementary modalities to
promote feature learning for each other. Comprehensive evaluations on several
benchmark databases corroborate the superior generalization performance of our
proposed method.
- Abstract(参考訳): 現在の顔偽造検出法は、同じアルゴリズムでトレーニングとテストの偽造を合成するデータベース内シナリオにおいて高い精度を達成する。
しかし、トレーニングとテストの偽造を異なるアルゴリズムで合成するクロスデータベースシナリオでは、パフォーマンスを満足できるものはほとんどない。
本稿では,現在のCNNベースの検出器は,手法固有の色彩テクスチャに過度に適合し,一般化に失敗する傾向にあることを示す。
画像ノイズが色のテクスチャを除去し,真偽領域と改ざん領域の相違を露呈するのを見て,その高周波ノイズを顔偽造検出に用いることを提案する。
高周波機能を完全に活用するために、3つの機能モジュールを慎重に設計する。
1つは、複数のスケールで高周波ノイズを抽出し、新しいモダリティを構成するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルのRGB特徴抽出器を誘導し、新しい視点から偽の痕跡に集中させる残留誘導型空間アテンションモジュールである。
最後に、2つの補完的モダリティ間の相関を利用して互いに機能学習を促進するクロスモダリティアテンションモジュールがある。
いくつかのベンチマークデータベースにおける総合評価は,提案手法の優れた一般化性能を裏付けるものである。
関連論文リスト
- Multiple Contexts and Frequencies Aggregation Network forDeepfake Detection [5.65128683992597]
ディープフェイク検出は、大量で多様なディープフェイク技術の開発において、生成モデルの急速な成長以来、課題に直面している。
近年の進歩は、バックボーン内の一般的な偽造特徴をモデル化するのではなく、空間領域や周波数領域からの特徴の導入に依存している。
2つのコアモジュールからなるMkfaNetという顔偽造検出のための効率的なネットワークを提案する。
論文 参考訳(メタデータ) (2024-08-03T05:34:53Z) - UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - Statistics-aware Audio-visual Deepfake Detector [11.671275975119089]
オーディオ・ヴィジュアルフェイク検出の手法は、主に音声と視覚の特徴の同期を評価する。
モデルの識別能力を高めるため,統計的特徴損失を提案する。
DFDCおよびFakeAVCelebデータセットの実験により,提案手法の妥当性が示された。
論文 参考訳(メタデータ) (2024-07-16T12:15:41Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Fully Differentiable Correlation-driven 2D/3D Registration for X-ray to CT Image Fusion [3.868072865207522]
画像ベース剛性2D/3Dレジストレーションは, 蛍光ガイド下外科手術において重要な技術である。
デュアルブランチCNN変換器エンコーダを用いた完全微分型相関型ネットワークを提案する。
組込み情報に基づく低周波特徴と高周波特徴の分解に対して相関型損失を提案する。
論文 参考訳(メタデータ) (2024-02-04T14:12:51Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - ReDFeat: Recoupling Detection and Description for Multimodal Feature
Learning [51.07496081296863]
我々は、相互重み付け戦略による多モーダル特徴学習の検出と記述の独立した制約を再定義する。
本研究では,大きな受容場を有し,学習可能な非最大抑制層を備える検出器を提案する。
我々は,特徴マッチングと画像登録タスクにおける特徴量を評価するために,クロス可視,赤外線,近赤外,合成開口レーダ画像ペアを含むベンチマークを構築した。
論文 参考訳(メタデータ) (2022-05-16T04:24:22Z) - Exploiting Fine-grained Face Forgery Clues via Progressive Enhancement
Learning [12.585152735152937]
偽造検知は セキュリティ上の懸念から ますます注目を集めています
既存のアプローチでは、周波数情報を使用して、高品質な偽造顔の下で微妙なアーティファクトをマイニングしようとする。
本稿では,RGBときめ細かな周波数手がかりの両方を活用できるプログレッシブエンハンスメント学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-28T03:18:53Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。