論文の概要: Multi-attentional Deepfake Detection
- arxiv url: http://arxiv.org/abs/2103.02406v1
- Date: Wed, 3 Mar 2021 13:56:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-04 14:59:26.226364
- Title: Multi-attentional Deepfake Detection
- Title(参考訳): マルチアテンショナルディープフェイク検出
- Authors: Hanqing Zhao, Wenbo Zhou, Dongdong Chen, Tianyi Wei, Weiming Zhang,
Nenghai Yu
- Abstract要約: ディープフェイクによる顔の偽造はインターネットに広まり、深刻な社会的懸念を引き起こしている。
新たなマルチアテンテーショナルディープフェイク検出ネットワークを提案する。
具体的には,1)ネットワークを異なる局所的部分へ配置するための複数の空間的注意ヘッド,2)浅い特徴の微妙なアーティファクトをズームするテクスチャ的特徴拡張ブロック,3)低レベルなテクスチャ特徴と高レベルなセマンティクス特徴をアグリゲートする,の3つの構成要素からなる。
- 参考スコア(独自算出の注目度): 79.80308897734491
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Face forgery by deepfake is widely spread over the internet and has raised
severe societal concerns. Recently, how to detect such forgery contents has
become a hot research topic and many deepfake detection methods have been
proposed. Most of them model deepfake detection as a vanilla binary
classification problem, i.e, first use a backbone network to extract a global
feature and then feed it into a binary classifier (real/fake). But since the
difference between the real and fake images in this task is often subtle and
local, we argue this vanilla solution is not optimal. In this paper, we instead
formulate deepfake detection as a fine-grained classification problem and
propose a new multi-attentional deepfake detection network. Specifically, it
consists of three key components: 1) multiple spatial attention heads to make
the network attend to different local parts; 2) textural feature enhancement
block to zoom in the subtle artifacts in shallow features; 3) aggregate the
low-level textural feature and high-level semantic features guided by the
attention maps. Moreover, to address the learning difficulty of this network,
we further introduce a new regional independence loss and an attention guided
data augmentation strategy. Through extensive experiments on different
datasets, we demonstrate the superiority of our method over the vanilla binary
classifier counterparts, and achieve state-of-the-art performance.
- Abstract(参考訳): ディープフェイクによる顔の偽造はインターネットに広まり、深刻な社会的懸念を引き起こしている。
近年,このような偽コンテンツの検出方法がホットな研究テーマとなり,多くのディープフェイク検出手法が提案されている。
その多くは、ディープフェイク検出をバニラバイナリ分類問題としてモデル化している。すなわち、まずバックボーンネットワークを使用してグローバル特徴を抽出し、次にバイナリ分類器(real/fake)に送信する。
しかし、このタスクにおける実画像と偽画像の違いは、しばしば微妙で局所的であるため、このバニラソリューションは最適ではないと主張する。
本論文では, ディープフェイク検出を細かい分類問題として定式化し, 新しいマルチアテンショナルディープフェイク検出ネットワークを提案する。
具体的には,1)ネットワークを異なる局所的部分へ配置するための複数の空間的注意ヘッド,2)浅い特徴の微妙なアーティファクトをズームするテクスチャ的特徴拡張ブロック,3)低レベルなテクスチャ特徴と高レベルなセマンティクス特徴をアグリゲートする,の3つの構成要素からなる。
さらに,このネットワークの学習の難しさに対処するために,新たな地域独立の喪失と注意喚起型データ強化戦略を導入する。
異なるデータセットに関する広範囲な実験を通じて,バニラバイナリ分類器よりも優れた手法を示し,最先端の性能を実現する。
関連論文リスト
- DF40: Toward Next-Generation Deepfake Detection [62.073997142001424]
既存の研究は、ある特定のデータセットで検出器をトレーニングし、他の一般的なディープフェイクデータセットでテストすることで、トップノーチ検出アルゴリズムとモデルを識別する。
しかし、これらの「勝者」は現実の世界に潜む無数の現実的で多様なディープフェイクに取り組むために真に応用できるのだろうか?
我々は,40の異なるディープフェイク技術からなるDF40という,高度に多様なディープフェイク検出データセットを構築した。
論文 参考訳(メタデータ) (2024-06-19T12:35:02Z) - Exposing the Deception: Uncovering More Forgery Clues for Deepfake
Detection [36.92399832886853]
現在のディープフェイク検出アプローチは、一箇所または数箇所の偽の手がかりにのみ焦点を絞って、オーバーフィッティングの罠に陥る可能性がある。
本稿では,複数の重複しない局所表現を抽出し,それらをグローバルな意味豊かな特徴に融合することにより,より広範な偽の手がかりを捉える新しい枠組みを提案する。
提案手法は,5つのベンチマークデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-04T07:28:23Z) - Facial Forgery-based Deepfake Detection using Fine-Grained Features [7.378937711027777]
ディープフェイクによる顔の偽造は、大きなセキュリティリスクを引き起こし、深刻な社会的懸念を引き起こしている。
我々は,詳細な分類問題としてディープフェイク検出を定式化し,それに対する新たなきめ細かな解を提案する。
本手法は, 背景雑音を効果的に抑制し, 様々なスケールの識別特徴を学習することにより, 微妙で一般化可能な特徴を学習し, 深度検出を行う。
論文 参考訳(メタデータ) (2023-10-10T21:30:05Z) - Deepfake Detection via Joint Unsupervised Reconstruction and Supervised
Classification [25.84902508816679]
本稿では,再建作業と分類作業を同時に行うディープフェイク検出手法を提案する。
この方法は、あるタスクによって学習された情報を他のタスクと共有する。
提案手法は,一般的に使用されている3つのデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-11-24T05:44:26Z) - Aggregating Layers for Deepfake Detection [20.191456827448736]
ネットワークが1つのDeepfakeアルゴリズムでトレーニングされ、別のアルゴリズムで生成されたDeepfakesでテストされる場合を考える。
我々のアルゴリズムは、あるバックボーンネットワークのすべての層から抽出された特徴を集約し、偽物を検出する。
本稿では,2つの関心領域(ディープフェイク検出と合成画像検出)に対するアプローチを評価し,SOTAの結果が得られたことを確かめる。
論文 参考訳(メタデータ) (2022-10-11T14:29:47Z) - Deep Convolutional Pooling Transformer for Deepfake Detection [54.10864860009834]
本研究では,局所的・グローバル的に決定的な画像特徴を取り入れた深部畳み込み変換器を提案する。
具体的には,抽出した特徴を充実させ,有効性を高めるために,畳み込みプーリングと再アテンションを適用した。
提案手法は、内部実験と相互データセット実験の両方において、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2022-09-12T15:05:41Z) - Detection of Deepfake Videos Using Long Distance Attention [73.6659488380372]
既存のほとんどの検出方法は、問題をバニラ二項分類問題として扱う。
本稿では,偽顔と実顔の相違が非常に微妙であるため,特にきめ細かな分類問題として扱われる。
大域的な視点で空間的・時間的偽の痕跡を捉えるための2つの要素を持つ時空間モデルを提案する。
論文 参考訳(メタデータ) (2021-06-24T08:33:32Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。