論文の概要: ADD: Frequency Attention and Multi-View based Knowledge Distillation to
Detect Low-Quality Compressed Deepfake Images
- arxiv url: http://arxiv.org/abs/2112.03553v1
- Date: Tue, 7 Dec 2021 07:58:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 14:47:56.718695
- Title: ADD: Frequency Attention and Multi-View based Knowledge Distillation to
Detect Low-Quality Compressed Deepfake Images
- Title(参考訳): ADD:低品質圧縮深度画像検出のための周波数注意と多視点知識蒸留
- Authors: Binh M. Le and Simon S. Woo
- Abstract要約: 本稿では,2つの新しい蒸留法からなる注意型ディープフェイク検出ディファイラ(ADD)を提案する。
提案手法は,低品質の圧縮深度画像の検出において,最先端のベースラインよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 19.126496628073376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite significant advancements of deep learning-based forgery detectors for
distinguishing manipulated deepfake images, most detection approaches suffer
from moderate to significant performance degradation with low-quality
compressed deepfake images. Because of the limited information in low-quality
images, detecting low-quality deepfake remains an important challenge. In this
work, we apply frequency domain learning and optimal transport theory in
knowledge distillation (KD) to specifically improve the detection of
low-quality compressed deepfake images. We explore transfer learning capability
in KD to enable a student network to learn discriminative features from
low-quality images effectively. In particular, we propose the Attention-based
Deepfake detection Distiller (ADD), which consists of two novel distillations:
1) frequency attention distillation that effectively retrieves the removed
high-frequency components in the student network, and 2) multi-view attention
distillation that creates multiple attention vectors by slicing the teacher's
and student's tensors under different views to transfer the teacher tensor's
distribution to the student more efficiently. Our extensive experimental
results demonstrate that our approach outperforms state-of-the-art baselines in
detecting low-quality compressed deepfake images.
- Abstract(参考訳): ディープフェイク画像の識別のためのディープラーニングベースの偽造検出装置の大幅な進歩にもかかわらず、ほとんどの検出手法は低品質のディープフェイク画像による中等度から顕著な性能劣化に悩まされている。
低画質画像の情報が限られているため、低品質のディープフェイクの検出は依然として重要な課題である。
本研究では,低品質の圧縮深度画像の検出を改善するために,周波数領域学習と最適輸送理論を知識蒸留(KD)に適用する。
学生ネットワークが低品質画像から識別的特徴を効果的に学習できるようにするため,kdにおける転送学習能力を検討する。
特に,2つの新しい蒸留法からなる注意型ディープフェイク検出ディファイラ(ADD)を提案する。
1)学生ネットワークで除去された高周波成分を効果的に回収する周波数注意蒸留、
2)教師と生徒のテンソルを異なる視点でスライスし,教師のテンソル分布をより効率的に学生に伝達することにより,複数の注意ベクトルを生成する多視点注意蒸留。
提案手法は,低品質圧縮ディープフェイク画像の検出において最先端のベースラインよりも優れることを示す。
関連論文リスト
- Look One and More: Distilling Hybrid Order Relational Knowledge for Cross-Resolution Image Recognition [30.568519905346253]
本稿では,ハイブリッド順序関係知識蒸留による低分解能画像認識を容易にするための教師学生学習手法を提案する。
提案手法は,教師ストリームを高精度に高精細画像を認識するために事前訓練し,教師の行動を模倣して低精細画像の識別を学習し,余分な補助ストリームを橋渡しとして導入し,教師から生徒への知識伝達を支援する。
論文 参考訳(メタデータ) (2024-09-09T07:32:18Z) - DA-HFNet: Progressive Fine-Grained Forgery Image Detection and Localization Based on Dual Attention [12.36906630199689]
DA-HFNet鍛造画像データセットをテキストまたは画像支援GANおよび拡散モデルで作成する。
我々のゴールは、階層的なプログレッシブネットワークを使用して、異なるスケールの偽造物を検出およびローカライゼーションするために捕獲することである。
論文 参考訳(メタデータ) (2024-06-03T16:13:33Z) - Exploring Deep Learning Image Super-Resolution for Iris Recognition [50.43429968821899]
重畳自動エンコーダ(SAE)と畳み込みニューラルネットワーク(CNN)の2つの深層学習単一画像超解法手法を提案する。
精度評価と認識実験により,1.872個の近赤外虹彩画像のデータベースを用いて評価を行い,比較アルゴリズムよりも深層学習の方が優れていることを示す。
論文 参考訳(メタデータ) (2023-11-02T13:57:48Z) - Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。
これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。
高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文 参考訳(メタデータ) (2023-08-24T12:32:46Z) - One-stage Low-resolution Text Recognition with High-resolution Knowledge
Transfer [53.02254290682613]
現在の低解像度テキスト認識のソリューションは、通常2段階のパイプラインに依存している。
本稿では,多段階の知識伝達を実現するための効率的かつ効果的な知識蒸留フレームワークを提案する。
実験の結果、提案されたワンステージパイプラインは、超高解像度ベースの2ステージフレームワークよりも大幅に優れていた。
論文 参考訳(メタデータ) (2023-08-05T02:33:45Z) - SeeABLE: Soft Discrepancies and Bounded Contrastive Learning for
Exposing Deepfakes [7.553507857251396]
本研究では,検出問題を(一級)アウト・オブ・ディストリビューション検出タスクとして形式化する,SeeABLEと呼ばれる新しいディープフェイク検出器を提案する。
SeeABLEは、新しい回帰ベースの有界コントラスト損失を使用して、乱れた顔を事前定義されたプロトタイプにプッシュする。
我々のモデルは競合する最先端の検出器よりも高い性能を示しながら、高度に一般化能力を示す。
論文 参考訳(メタデータ) (2022-11-21T09:38:30Z) - Deep Convolutional Pooling Transformer for Deepfake Detection [54.10864860009834]
本研究では,局所的・グローバル的に決定的な画像特徴を取り入れた深部畳み込み変換器を提案する。
具体的には,抽出した特徴を充実させ,有効性を高めるために,畳み込みプーリングと再アテンションを適用した。
提案手法は、内部実験と相互データセット実験の両方において、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2022-09-12T15:05:41Z) - Learning Efficient Representations for Enhanced Object Detection on
Large-scene SAR Images [16.602738933183865]
SAR(Synthetic Aperture Radar)画像のターゲットの検出と認識は難しい問題である。
近年開発されたディープラーニングアルゴリズムは,SAR画像の固有の特徴を自動的に学習することができる。
本稿では,効率的かつ堅牢なディープラーニングに基づくターゲット検出手法を提案する。
論文 参考訳(メタデータ) (2022-01-22T03:25:24Z) - SWIPENET: Object detection in noisy underwater images [41.35601054297707]
本稿では,この2つの問題に対処するために,Sample-WeIghted hyPEr Network(SWIPENET)とCurriculum Multi-Class Adaboost(CMA)という堅牢なトレーニングパラダイムを提案する。
SWIPENETのバックボーンは、複数の高解像度かつセマンティックリッチなハイパーフィーチャーマップを生成し、小さなオブジェクト検出を大幅に改善する。
簡単な概念から難しい概念まで学習を促進する人間の教育プロセスに着想を得て,まず騒音の影響を受けないクリーンな検出器を訓練するCMA訓練パラダイムを提案する。
論文 参考訳(メタデータ) (2020-10-19T16:41:20Z) - Attention-Aware Noisy Label Learning for Image Classification [97.26664962498887]
大規模ラベル付きサンプルで学習した深層畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおいて顕著な進歩を遂げている。
大量のラベル付きビジュアルデータを取得する最も安価な方法は、Flickrのようなユーザーが提供するラベルでウェブサイトからクロールすることである。
本稿では,潜在的なラベルノイズのあるデータセットに基づいて学習したネットワークの識別能力を向上させるために,注目に敏感なラベル学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-30T15:45:36Z) - Circumventing Outliers of AutoAugment with Knowledge Distillation [102.25991455094832]
AutoAugmentは多くの視覚タスクの精度を向上させる強力なアルゴリズムである。
本論文は作業機構を深く掘り下げ,AutoAugmentがトレーニング画像から識別情報の一部を除去できることを明らかにする。
教師モデルの出力に言及した知識蒸留を用いて,ネットワークトレーニングの指導を行う。
論文 参考訳(メタデータ) (2020-03-25T11:51:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。