論文の概要: Anisotropic multiresolution analyses for deep fake detection
- arxiv url: http://arxiv.org/abs/2210.14874v1
- Date: Wed, 26 Oct 2022 17:26:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 15:06:42.771009
- Title: Anisotropic multiresolution analyses for deep fake detection
- Title(参考訳): ディープフェイク検出のための異方性マルチレゾリューション解析
- Authors: Wei Huang and Michelangelo Valsecchi and Michael Multerer
- Abstract要約: Generative Adversarial Networks (GANs) は完全に新しいメディア生成機能への道を開いた。
また、悪用されたり悪用されたりして、精巧な嘘をつくり、大衆の議論を呼び起こすことができる。
これまでの研究では、k-アネレスト近隣や固有顔といった古典的な機械学習技術を用いてこの課題に取り組んできた。
GANは、主に等方的畳み込みを利用して出力を生成するため、異方的変換によって抽出されたサブバンド上の係数分布に明確な痕跡、指紋を残す。
- 参考スコア(独自算出の注目度): 4.903718320156974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Adversarial Networks (GANs) have paved the path towards entirely
new media generation capabilities at the forefront of image, video, and audio
synthesis. However, they can also be misused and abused to fabricate elaborate
lies, capable of stirring up the public debate. The threat posed by GANs has
sparked the need to discern between genuine content and fabricated one.
Previous studies have tackled this task by using classical machine learning
techniques, such as k-nearest neighbours and eigenfaces, which unfortunately
did not prove very effective. Subsequent methods have focused on leveraging on
frequency decompositions, i.e., discrete cosine transform, wavelets, and
wavelet packets, to preprocess the input features for classifiers. However,
existing approaches only rely on isotropic transformations. We argue that,
since GANs primarily utilize isotropic convolutions to generate their output,
they leave clear traces, their fingerprint, in the coefficient distribution on
sub-bands extracted by anisotropic transformations. We employ the fully
separable wavelet transform and multiwavelets to obtain the anisotropic
features to feed to standard CNN classifiers. Lastly, we find the fully
separable transform capable of improving the state-of-the-art.
- Abstract(参考訳): generative adversarial networks (gans)は、画像、ビデオ、音声合成の最前線で、全く新しいメディア生成機能への道を開いた。
しかし、それを誤用して悪用して精巧な嘘をつくり、大衆の議論をかき立てることもできる。
GANが引き起こした脅威は、本物のコンテンツと製造されたものを区別する必要性を喚起した。
これまでの研究では、k-nearest neighborsやeigenfacesといった古典的な機械学習技術を使ってこの課題に取り組んできたが、残念ながらあまり効果がなかった。
その後の手法は周波数分解、すなわち離散コサイン変換、ウェーブレット、ウェーブレットパケットを利用して分類器の入力特徴を前処理することに集中している。
しかし、既存のアプローチは等方変換のみに依存する。
GANは、主に等方的畳み込みを利用して出力を生成するため、異方的変換によって抽出されたサブバンド上の係数分布に明確な痕跡、指紋を残す。
我々は、完全分離可能なウェーブレット変換とマルチウェーブレットを用いて、標準CNN分類器にフィードする異方性特徴を得る。
最後に、最先端技術を改善することができる完全分離可能な変換を見出す。
関連論文リスト
- Tilt your Head: Activating the Hidden Spatial-Invariance of Classifiers [0.7704032792820767]
ディープニューラルネットワークは、日々の生活の多くの領域に適用されている。
これらは、空間的に変換された入力信号に頑健に対処するなど、依然として必須の能力が欠如している。
本稿では,ニューラルネットの推論過程をエミュレートする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-06T09:47:29Z) - Short-Time Fourier Transform for deblurring Variational Autoencoders [0.0]
変分オートエンコーダ(VAE)は強力な生成モデルである。
彼らの生成したサンプルは、代替生成技術の出力と比較して、特徴的な曖昧さに悩まされていることが知られている。
論文 参考訳(メタデータ) (2024-01-06T08:57:11Z) - Rethinking the Up-Sampling Operations in CNN-based Generative Network
for Generalizable Deepfake Detection [86.97062579515833]
我々は、アップサンプリング操作から生じる一般化された構造的アーティファクトをキャプチャし、特徴付ける手段として、NPR(Neighboring Pixel Relationships)の概念を紹介した。
tft28の異なる生成モデルによって生成されたサンプルを含む、オープンワールドデータセット上で包括的な分析を行う。
この分析は、新しい最先端のパフォーマンスを確立し、既存の手法よりも優れたtft11.6%の向上を示している。
論文 参考訳(メタデータ) (2023-12-16T14:27:06Z) - Deep Transformers without Shortcuts: Modifying Self-attention for
Faithful Signal Propagation [105.22961467028234]
ディープニューラルネットワーク(DNN)のトレーニングにおいて,スキップ接続と正規化レイヤはユビキタスである
Deep Kernel Shapingのような最近のアプローチは、それらへの依存を減らすために進歩しました。
しかし、これらのアプローチは変換器に存在する自己注意層とは相容れない。
論文 参考訳(メタデータ) (2023-02-20T21:26:25Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - GeoDiff: a Geometric Diffusion Model for Molecular Conformation
Generation [102.85440102147267]
分子配座予測のための新しい生成モデルGeoDiffを提案する。
GeoDiffは、既存の最先端のアプローチよりも優れているか、あるいは同等であることを示す。
論文 参考訳(メタデータ) (2022-03-06T09:47:01Z) - Simpler is better: spectral regularization and up-sampling techniques
for variational autoencoders [1.2234742322758418]
ニューラルネットワークに基づく生成モデルのスペクトル挙動のキャラクタリゼーションは未解決のままである。
最近の研究は、生成的対向ネットワークと、実画像と生成画像の高周波の相違に重点を置いている。
変分オートエンコーダ(VAE)のための単純な2次元フーリエ変換に基づくスペクトル正規化損失を提案する。
論文 参考訳(メタデータ) (2022-01-19T11:49:57Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - GANs with Variational Entropy Regularizers: Applications in Mitigating
the Mode-Collapse Issue [95.23775347605923]
深層学習の成功に基づいて、GAN(Generative Adversarial Networks)は、観測されたサンプルから確率分布を学習するための現代的なアプローチを提供する。
GANはしばしば、ジェネレータが入力分布の既存のすべてのモードをキャプチャできないモード崩壊問題に悩まされる。
情報理論のアプローチを採り、生成したサンプルのエントロピーの変動的下限を最大化し、それらの多様性を増大させる。
論文 参考訳(メタデータ) (2020-09-24T19:34:37Z) - Non-parallel Emotion Conversion using a Deep-Generative Hybrid Network
and an Adversarial Pair Discriminator [16.18921154013272]
本稿では,並列学習データを必要としない音声における感情変換手法を提案する。
従来のサイクルGANとは異なり、我々の判別器は1対の入力実と生成されたサンプルが所望の感情変換に対応するかどうかを分類する。
本稿では,Wavenet が生成した音声を改良することにより,新しい話者に一般化することを示す。
論文 参考訳(メタデータ) (2020-07-25T13:50:00Z) - Watch your Up-Convolution: CNN Based Generative Deep Neural Networks are
Failing to Reproduce Spectral Distributions [13.439086686599891]
上向きの畳み込みあるいは転置畳み込みは、そのようなモデルが自然学習データのスペクトル分布を正確に再現できないことを示します。
トレーニング最適化の目的に新しいスペクトル正規化項を加えることを提案する。
提案手法は,周波数誤差を回避したスペクトル一貫したGANの訓練を可能にする。
論文 参考訳(メタデータ) (2020-03-03T23:04:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。