論文の概要: Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in
Frequency Domain
- arxiv url: http://arxiv.org/abs/2103.01856v1
- Date: Tue, 2 Mar 2021 16:45:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-03 16:23:59.141712
- Title: Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in
Frequency Domain
- Title(参考訳): 空間位相浅層学習:周波数領域における顔偽造検出の再考
- Authors: Honggu Liu, Xiaodan Li, Wenbo Zhou, Yuefeng Chen, Yuan He, Hui Xue,
Weiming Zhang and Nenghai Yu
- Abstract要約: 本論文では,空間画像と位相スペクトルを組み合わせ,顔の偽造のアップサンプリング成果をキャプチャするSPSL(Spatial-Phase Shallow Learning)法を提案する。
SPSLは、クロスデータセット評価における最先端性能とマルチクラス分類を実現し、単一データセット評価において同等の結果を得ることができる。
- 参考スコア(独自算出の注目度): 88.7339322596758
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The remarkable success in face forgery techniques has received considerable
attention in computer vision due to security concerns. We observe that
up-sampling is a necessary step of most face forgery techniques, and cumulative
up-sampling will result in obvious changes in the frequency domain, especially
in the phase spectrum. According to the property of natural images, the phase
spectrum preserves abundant frequency components that provide extra information
and complement the loss of the amplitude spectrum. To this end, we present a
novel Spatial-Phase Shallow Learning (SPSL) method, which combines spatial
image and phase spectrum to capture the up-sampling artifacts of face forgery
to improve the transferability, for face forgery detection. And we also
theoretically analyze the validity of utilizing the phase spectrum. Moreover,
we notice that local texture information is more crucial than high-level
semantic information for the face forgery detection task. So we reduce the
receptive fields by shallowing the network to suppress high-level features and
focus on the local region. Extensive experiments show that SPSL can achieve the
state-of-the-art performance on cross-datasets evaluation as well as
multi-class classification and obtain comparable results on single dataset
evaluation.
- Abstract(参考訳): 顔偽造技術における顕著な成功は、セキュリティ上の懸念からコンピュータビジョンにおいて大きな注目を集めている。
我々は、アップサンプリングがほとんどの顔偽造技術に必要なステップであり、累積アップサンプリングは、特に位相スペクトルにおいて、周波数領域に明らかな変化をもたらすことを観察する。
自然画像の特性によると、位相スペクトルは余分な情報を提供し、振幅スペクトルの損失を補完する豊富な周波数成分を保持します。
そこで本論文では, 空間画像と位相スペクトルを組み合わせ, 顔偽造のアップサンプリングアーチファクトを捕捉し, 顔偽造検出のための移動性を改善する, 空間位相浅化学習(SPSL)法を提案する。
また、位相スペクトルの有効性も理論的に解析します。
さらに,顔偽造検出タスクにおいて,局所的なテクスチャ情報の方が高レベルな意味情報よりも重要であることに気付く。
そこで我々は,ネットワークを浅め,高次特徴を抑え,局所領域に焦点を合わせることにより受容場を小さくする。
大規模な実験により,SPSLはクロスデータセット評価における最先端性能とマルチクラス分類を達成でき,単一データセット評価において同等の結果を得ることができることが示された。
関連論文リスト
- Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Diffusion Facial Forgery Detection [56.69763252655695]
本稿では,顔に焦点をあてた拡散生成画像を対象とした包括的データセットであるDiFFを紹介する。
人体実験といくつかの代表的な偽造検出手法を用いて,DiFFデータセットの広範な実験を行った。
その結果、人間の観察者と自動検出者の2値検出精度は30%以下であることが判明した。
論文 参考訳(メタデータ) (2024-01-29T03:20:19Z) - FS-BAND: A Frequency-Sensitive Banding Detector [55.59101150019851]
バンディング・アーティファクト(Banding artifact)は、階段のような輪郭(contour)として知られ、圧縮や伝達などで発生する一般的な品質の不快さである。
周波数感度バンディング検出器 (FS-BAND) と呼ばれる,帯状アーティファクトを捕捉・評価するための非参照帯状検出モデルを提案する。
実験結果から,FS-BAND法は画像品質評価(IQA)手法よりもバンドリング分類タスクの精度が高い結果を得た。
論文 参考訳(メタデータ) (2023-11-30T03:20:42Z) - A Survey of Graph and Attention Based Hyperspectral Image Classification
Methods for Remote Sensing Data [5.1901440366375855]
ハイパースペクトルイメージング(HSI)の分類におけるディープラーニング技術の利用は急速に増加している。
最近の手法では、グラフ畳み込みネットワークの利用と、予測にノード機能を使用するユニークな機能についても検討されている。
論文 参考訳(メタデータ) (2023-10-16T00:42:25Z) - Attention Consistency Refined Masked Frequency Forgery Representation
for Generalizing Face Forgery Detection [96.539862328788]
既存の偽造検出方法は、未確認領域の真正性を決定する不満足な一般化能力に悩まされている。
ACMF(Attention Consistency Refined masked frequency forgery representation model)を提案する。
いくつかのパブリックフェイスフォージェリーデータセットの実験結果から,提案手法の性能は最先端の手法と比較して優れていることが示された。
論文 参考訳(メタデータ) (2023-07-21T08:58:49Z) - MC-LCR: Multi-modal contrastive classification by locally correlated
representations for effective face forgery detection [11.124150983521158]
局所的関連表現を用いたマルチモーダルコントラスト分類法を提案する。
我々のMC-LCRは、空間領域と周波数領域の両方から真偽顔と偽顔の暗黙の局所的不一致を増幅することを目的としている。
我々は最先端の性能を達成し,本手法の堅牢性と一般化を実証する。
論文 参考訳(メタデータ) (2021-10-07T09:24:12Z) - Amplitude-Phase Recombination: Rethinking Robustness of Convolutional
Neural Networks in Frequency Domain [31.182376196295365]
CNNは、トレーニング画像の高周波成分と密接に関連する局所最適値に収束する傾向にある。
現在の画像の位相スペクトルとイントラクタ画像の振幅スペクトルを再結合して設計されたデータ拡張に関する新しい視点。
論文 参考訳(メタデータ) (2021-08-19T04:04:41Z) - SSCAN: A Spatial-spectral Cross Attention Network for Hyperspectral
Image Denoising [12.873607414761093]
本稿では,グループ畳み込みとアテンションモジュールを組み合わせた新しいHSIデノベーションネットワークSSCANを提案する。
ハイパースペクトル画像における空間情報とスペクトル情報を有効利用するためのスペクトル空間アテンションブロック(SSAB)を提案する。
実験結果から,提案したSSCANは,最先端のHSI復調アルゴリズムよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2021-05-23T14:36:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。