論文の概要: Data-Independent Operator: A Training-Free Artifact Representation
Extractor for Generalizable Deepfake Detection
- arxiv url: http://arxiv.org/abs/2403.06803v1
- Date: Mon, 11 Mar 2024 15:22:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-12 18:32:29.503814
- Title: Data-Independent Operator: A Training-Free Artifact Representation
Extractor for Generalizable Deepfake Detection
- Title(参考訳): データ独立演算子:deepfake検出を一般化するトレーニングフリーアーティファクト表現抽出器
- Authors: Chuangchuang Tan, Ping Liu, RenShuai Tao, Huan Liu, Yao Zhao, Baoyuan
Wu, Yunchao Wei
- Abstract要約: 本研究では,より一般的な人工物表現を捉えるのに,小型かつトレーニング不要なフィルタが十分であることを示す。
トレーニングソースとテストソースの両方に不偏があるため、未確認ソースに対して魅力的な改善を実現するために、Data-Independent Operator (DIO)と定義する。
我々の検出器は13.3%の大幅な改善を実現し、新しい最先端の性能を確立した。
- 参考スコア(独自算出の注目度): 105.9932053078449
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, the proliferation of increasingly realistic synthetic images
generated by various generative adversarial networks has increased the risk of
misuse. Consequently, there is a pressing need to develop a generalizable
detector for accurately recognizing fake images. The conventional methods rely
on generating diverse training sources or large pretrained models. In this
work, we show that, on the contrary, the small and training-free filter is
sufficient to capture more general artifact representations. Due to its unbias
towards both the training and test sources, we define it as Data-Independent
Operator (DIO) to achieve appealing improvements on unseen sources. In our
framework, handcrafted filters and the randomly-initialized convolutional layer
can be used as the training-free artifact representations extractor with
excellent results. With the data-independent operator of a popular classifier,
such as Resnet50, one could already reach a new state-of-the-art without bells
and whistles. We evaluate the effectiveness of the DIO on 33 generation models,
even DALLE and Midjourney. Our detector achieves a remarkable improvement of
$13.3\%$, establishing a new state-of-the-art performance. The DIO and its
extension can serve as strong baselines for future methods. The code is
available at
\url{https://github.com/chuangchuangtan/Data-Independent-Operator}.
- Abstract(参考訳): 近年,様々な生成的対向ネットワークが生み出す現実的な合成画像の拡散は,誤用リスクを高めている。
そのため、偽画像を正確に認識する汎用検出器を開発する必要がある。
従来の方法は、多様なトレーニングソースや大きな事前トレーニングモデルの生成に依存している。
本研究では,より一般的なアーティファクト表現をキャプチャするには,小型でトレーニング不要なフィルタが十分であることを示す。
トレーニングソースとテストソースの両方に不偏があるため、未確認ソースに対して魅力的な改善を実現するために、Data-Independent Operator (DIO)と定義する。
本フレームワークでは,手作りフィルタとランダム初期化畳み込み層をトレーニング不要なアーティファクト表現抽出器として,優れた結果が得られる。
resnet50のような一般的な分類器のデータ独立オペレータでは、ベルやホイッスルなしで新しい最先端に到達できる。
DALLEやMidjourneyでさえも,第33世代モデルにおけるDIOの有効性を評価する。
我々の検出器は13.3 %の大幅な改善を実現し、新しい最先端の性能を確立した。
DIOとその拡張は、将来のメソッドの強力なベースラインとして機能する。
コードは \url{https://github.com/chuangchuangtan/data-independent-operator} で入手できる。
関連論文リスト
- Zero-Shot Detection of AI-Generated Images [54.01282123570917]
AI生成画像を検出するゼロショットエントロピー検出器(ZED)を提案する。
機械によるテキスト検出の最近の研究に触発された私たちのアイデアは、分析対象の画像が実際の画像のモデルと比較してどれだけ驚くかを測定することである。
ZEDは精度の点でSoTAよりも平均3%以上改善されている。
論文 参考訳(メタデータ) (2024-09-24T08:46:13Z) - Adversarial Robustification via Text-to-Image Diffusion Models [56.37291240867549]
アドリラルロバスト性は、ニューラルネットワークをエンコードする難しい性質として伝統的に信じられてきた。
データを使わずに敵の堅牢性を実現するために,スケーラブルでモデルに依存しないソリューションを開発した。
論文 参考訳(メタデータ) (2024-07-26T10:49:14Z) - InstaGen: Enhancing Object Detection by Training on Synthetic Dataset [59.445498550159755]
本稿では,オブジェクト検出機能の向上,例えばカテゴリ拡大や検出性能の向上など,新たなパラダイムを提案する。
我々は、インスタンスレベルのグラウンドヘッドを事前訓練された生成拡散モデルに統合し、生成された画像のインスタンスをローカライズする機能で拡張する。
我々は、InstaGenと呼ばれる拡散モデルの強化版がデータシンセサイザーとして機能することを示すために、徹底的な実験を行う。
論文 参考訳(メタデータ) (2024-02-08T18:59:53Z) - Towards Better Data Exploitation in Self-Supervised Monocular Depth
Estimation [14.262669370264994]
本稿では、データセットのトレーニングの可能性を完全に活用するために、Resizing-CroppingとSplitting-Permutingという2つのデータ拡張手法を用いる。
具体的には、原画像と生成した2つの拡張イメージを同時にトレーニングパイプラインに供給し、自己蒸留を行う。
実験により,KITTIベンチマークを用いて,地中真理と地中真理の両面から,最先端の性能を実証した。
論文 参考訳(メタデータ) (2023-09-11T06:18:05Z) - GSURE-Based Diffusion Model Training with Corrupted Data [35.56267114494076]
本稿では, 劣化データのみに基づく生成拡散モデルのための新しいトレーニング手法を提案する。
顔画像と磁気共鳴画像(MRI)の撮影技術について紹介する。
論文 参考訳(メタデータ) (2023-05-22T15:27:20Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Self-supervised Transformer for Deepfake Detection [112.81127845409002]
現実世界のシナリオにおけるディープフェイク技術は、顔偽造検知器のより強力な一般化能力を必要とする。
転送学習に触発されて、他の大規模な顔関連タスクで事前訓練されたニューラルネットワークは、ディープフェイク検出に有用な機能を提供する可能性がある。
本稿では,自己教師型変換器を用いた音声視覚コントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2022-03-02T17:44:40Z) - Match What Matters: Generative Implicit Feature Replay for Continual
Learning [0.0]
クラス増分学習のためのGenIFeR(Generative Implicit Feature Replay)を提案する。
主な目的は、GAN(Generative Adversarial Network)をトレーニングして、現実的な特徴を含む画像を生成することである。
我々は、GenIFeRが従来の生成画像と特徴再生の両方よりも優れていることを実証的に示す。
論文 参考訳(メタデータ) (2021-06-09T19:29:41Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。