論文の概要: Fake Visual Content Detection Using Two-Stream Convolutional Neural
Networks
- arxiv url: http://arxiv.org/abs/2101.00676v1
- Date: Sun, 3 Jan 2021 18:05:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 01:31:12.567401
- Title: Fake Visual Content Detection Using Two-Stream Convolutional Neural
Networks
- Title(参考訳): 2ストリーム畳み込みニューラルネットワークを用いたフェイクビジュアルコンテンツ検出
- Authors: Bilal Yousaf, Muhammad Usama, Waqas Sultani, Arif Mahmood, Junaid
Qadir
- Abstract要約: 周波数領域と空間領域の特徴を補完する2ストリーム畳み込みニューラルネットワークアーキテクチャであるTwoStreamNetを提案する。
提案手法は, 現状の偽コンテンツ検出装置に比べ, 大幅に性能が向上した。
- 参考スコア(独自算出の注目度): 14.781702606707642
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rapid progress in adversarial learning has enabled the generation of
realistic-looking fake visual content. To distinguish between fake and real
visual content, several detection techniques have been proposed. The
performance of most of these techniques however drops off significantly if the
test and the training data are sampled from different distributions. This
motivates efforts towards improving the generalization of fake detectors. Since
current fake content generation techniques do not accurately model the
frequency spectrum of the natural images, we observe that the frequency
spectrum of the fake visual data contains discriminative characteristics that
can be used to detect fake content. We also observe that the information
captured in the frequency spectrum is different from that of the spatial
domain. Using these insights, we propose to complement frequency and spatial
domain features using a two-stream convolutional neural network architecture
called TwoStreamNet. We demonstrate the improved generalization of the proposed
two-stream network to several unseen generation architectures, datasets, and
techniques. The proposed detector has demonstrated significant performance
improvement compared to the current state-of-the-art fake content detectors and
fusing the frequency and spatial domain streams has also improved
generalization of the detector.
- Abstract(参考訳): 対人学習の急速な進歩により、現実的な偽のビジュアルコンテンツの生成が可能になった。
偽物と実物とを区別するために、いくつかの検出手法が提案されている。
しかし、テストとトレーニングデータが異なる分布からサンプリングされた場合、これらの手法のほとんどのパフォーマンスは大幅に低下する。
これは偽の検出器の一般化を改善する努力を動機付けている。
現在の偽コンテンツ生成技術は、自然画像の周波数スペクトルを正確にモデル化しないので、偽画像の周波数スペクトルには、偽コンテンツの検出に使用できる識別特性が含まれていることを観察する。
また,周波数スペクトルで取得した情報が空間領域と異なることも観察した。
これらの知見を用いて,2-stream convolutional neural networkアーキテクチャであるtwostreamnetを用いて,周波数領域と空間領域の特徴を補完する手法を提案する。
提案する2ストリームネットワークを,いくつかの未知の世代アーキテクチャ,データセット,技術に改良した一般化を実証する。
提案した検出器は,現在最先端の偽コンテンツ検出装置と比較して顕著な性能向上を示し,周波数と空間領域の流れを融合させ,検出器の一般化も改善した。
関連論文リスト
- Detecting Inpainted Video with Frequency Domain Insights [0.0]
本稿では、検出精度を大幅に向上させる周波数領域洞察ネットワーク(FDIN)を提案する。
公開データセットに対する以前の評価は、FDINが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2024-09-21T01:51:07Z) - Multiple Contexts and Frequencies Aggregation Network forDeepfake Detection [5.65128683992597]
ディープフェイク検出は、大量で多様なディープフェイク技術の開発において、生成モデルの急速な成長以来、課題に直面している。
近年の進歩は、バックボーン内の一般的な偽造特徴をモデル化するのではなく、空間領域や周波数領域からの特徴の導入に依存している。
2つのコアモジュールからなるMkfaNetという顔偽造検出のための効率的なネットワークを提案する。
論文 参考訳(メタデータ) (2024-08-03T05:34:53Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Multimodal Graph Learning for Deepfake Detection [10.077496841634135]
既存のディープフェイク検出器は、堅牢性と一般化を達成する上でいくつかの課題に直面している。
本稿では,マルチモーダルグラフ学習(MGL)という新しいフレームワークを提案する。
提案手法は,ディープフェイク検出のための特徴を効果的に識別し,活用することを目的としている。
論文 参考訳(メタデータ) (2022-09-12T17:17:49Z) - Deep Convolutional Pooling Transformer for Deepfake Detection [54.10864860009834]
本研究では,局所的・グローバル的に決定的な画像特徴を取り入れた深部畳み込み変換器を提案する。
具体的には,抽出した特徴を充実させ,有効性を高めるために,畳み込みプーリングと再アテンションを適用した。
提案手法は、内部実験と相互データセット実験の両方において、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2022-09-12T15:05:41Z) - Spatial-Temporal Frequency Forgery Clue for Video Forgery Detection in
VIS and NIR Scenario [87.72258480670627]
既存の周波数領域に基づく顔偽造検出手法では、GAN鍛造画像は、実際の画像と比較して、周波数スペクトルに明らかな格子状の視覚的アーチファクトを持つ。
本稿では,コサイン変換に基づくフォージェリークリュー拡張ネットワーク(FCAN-DCT)を提案し,より包括的な時空間特徴表現を実現する。
論文 参考訳(メタデータ) (2022-07-05T09:27:53Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - Attention-based Dual-stream Vision Transformer for Radar Gait
Recognition [24.90100456414406]
レーダー歩行認識は、光の変動に頑丈で、プライバシーに対する侵害も少ない。
本研究では、注意に基づく融合を伴う2重ストリームニューラルネットワークを提案し、識別情報を完全集約する。
提案手法は,レーダ歩行認識のための大規模なベンチマークデータセット上で検証され,最先端のソリューションよりも著しく優れていることを示す。
論文 参考訳(メタデータ) (2021-11-24T06:16:53Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Beyond the Spectrum: Detecting Deepfakes via Re-Synthesis [69.09526348527203]
ディープフェイク(Deepfakes)として知られる非常に現実的なメディアは、現実の目から人間の目まで区別できない。
本研究では,テスト画像を再合成し,検出のための視覚的手がかりを抽出する,新しい偽検出手法を提案する。
種々の検出シナリオにおいて,提案手法の摂動に対する有効性の向上,GANの一般化,堅牢性を示す。
論文 参考訳(メタデータ) (2021-05-29T21:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。