論文の概要: MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection
- arxiv url: http://arxiv.org/abs/2109.07311v1
- Date: Wed, 15 Sep 2021 14:11:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-16 19:18:41.797661
- Title: MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection
- Title(参考訳): MD-CSDNetwork:ディープフェイク検出のためのマルチドメインクロスステッチネットワーク
- Authors: Aayushi Agarwal, Akshay Agarwal, Sayan Sinha, Mayank Vatsa, Richa
Singh
- Abstract要約: 現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
- 参考スコア(独自算出の注目度): 80.83725644958633
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid progress in the ease of creating and spreading ultra-realistic
media over social platforms calls for an urgent need to develop a generalizable
deepfake detection technique. It has been observed that current deepfake
generation methods leave discriminative artifacts in the frequency spectrum of
fake images and videos. Inspired by this observation, in this paper, we present
a novel approach, termed as MD-CSDNetwork, for combining the features in the
spatial and frequency domains to mine a shared discriminative representation
for classifying \textit{deepfakes}. MD-CSDNetwork is a novel cross-stitched
network with two parallel branches carrying the spatial and frequency
information, respectively. We hypothesize that these multi-domain input data
streams can be considered as related supervisory signals. The supervision from
both branches ensures better performance and generalization. Further, the
concept of cross-stitch connections is utilized where they are inserted between
the two branches to learn an optimal combination of domain-specific and shared
representations from other domains automatically. Extensive experiments are
conducted on the popular benchmark dataset namely FaceForeniscs++ for forgery
classification. We report improvements over all the manipulation types in
FaceForensics++ dataset and comparable results with state-of-the-art methods
for cross-database evaluation on the Celeb-DF dataset and the Deepfake
Detection Dataset.
- Abstract(参考訳): ソーシャルプラットフォーム上で超現実的メディアを作成・拡散する容易さの急速な進歩は、汎用的なディープフェイク検出技術の開発を緊急に要求する。
現在のディープフェイク生成法は、偽画像やビデオの周波数スペクトルに識別的アーティファクトを残すことが観察されている。
本稿では,この観察に触発されて,空間領域と周波数領域の特徴を組み合わせて,<textit{deepfakes} を分類するための共有識別表現を探索する,md-csdnetworkと呼ばれる新しい手法を提案する。
MD-CSDNetworkは、空間情報と周波数情報をそれぞれ持つ2つの並列分岐を持つ、新しいクロススティッチネットワークである。
我々は、これらのマルチドメイン入力データストリームを関連する監視信号とみなすことができると仮定する。
両方のブランチの監督により、パフォーマンスと一般化が向上する。
さらに、クロススティッチ接続の概念は、2つのブランチの間に挿入され、他のドメインからドメイン固有表現と共有表現の最適な組み合わせを学習するために使われる。
一般的なベンチマークデータセットであるfaceforeniscs++ for forgery分類に関する広範な実験が行われた。
Celeb-DFデータセットとDeepfake Detection Datasetのクロスデータベース評価のための最先端手法を用いて、FaceForensics++データセットの操作タイプと同等の結果を報告した。
関連論文リスト
- Contextual Cross-Modal Attention for Audio-Visual Deepfake Detection and Localization [3.9440964696313485]
デジタル時代には、ディープフェイクや合成メディアの出現は、社会的・政治的整合性に対する重大な脅威となる。
オーディオ視覚のようなマルチモーダル操作に基づくディープフェイクは、より現実的であり、より大きな脅威をもたらす。
本稿では,音声・視覚的ディープフェイク検出にコンテキスト情報を活用する,リカレントニューラルネットワーク(RNN)に基づく新しいマルチモーダルアテンションフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-02T18:45:01Z) - Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - ATTA: Anomaly-aware Test-Time Adaptation for Out-of-Distribution
Detection in Segmentation [22.084967085509387]
ドメインシフトとセマンティックシフトを協調的に扱うための二重レベルOOD検出フレームワークを提案する。
第1のレベルは、グローバルな低レベル機能を活用することで、画像内にドメインシフトが存在するかどうかを区別する。
第2のレベルは、高次特徴写像を高密度に利用することにより、セマンティックシフトを伴う画素を識別する。
論文 参考訳(メタデータ) (2023-09-12T06:49:56Z) - Hierarchical Forgery Classifier On Multi-modality Face Forgery Clues [61.37306431455152]
我々は,HFC-MFFD (hierarchical Forgery for Multi-modality Face Forgery Detection) を提案する。
HFC-MFFDは、マルチモーダルシナリオにおけるフォージェリー認証を強化するために、堅牢なパッチベースのハイブリッド表現を学習する。
クラス不均衡問題を緩和し、さらに検出性能を高めるために、特定の階層的な顔偽造を提案する。
論文 参考訳(メタデータ) (2022-12-30T10:54:29Z) - Deepfake Detection via Joint Unsupervised Reconstruction and Supervised
Classification [25.84902508816679]
本稿では,再建作業と分類作業を同時に行うディープフェイク検出手法を提案する。
この方法は、あるタスクによって学習された情報を他のタスクと共有する。
提案手法は,一般的に使用されている3つのデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-11-24T05:44:26Z) - Cross-Domain Facial Expression Recognition: A Unified Evaluation
Benchmark and Adversarial Graph Learning [85.6386289476598]
我々は,クロスドメイン全体的特徴共適応のための新しい逆グラフ表現適応(AGRA)フレームワークを開発した。
我々は,いくつかの一般的なベンチマークで広範囲かつ公平な評価を行い,提案したAGRAフレームワークが従来の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-03T15:00:31Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。