論文の概要: MVFNet: Multipurpose Video Forensics Network using Multiple Forms of Forensic Evidence
- arxiv url: http://arxiv.org/abs/2503.20991v1
- Date: Wed, 26 Mar 2025 21:11:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:52:53.719054
- Title: MVFNet: Multipurpose Video Forensics Network using Multiple Forms of Forensic Evidence
- Title(参考訳): MVFNet:複数形態の法定証拠を用いた多目的ビデオフォレスシクスネットワーク
- Authors: Tai D. Nguyen, Matthew C. Stamm,
- Abstract要約: MVFNetは、インペイント、ディープフェイク、スプライシング、編集など、さまざまな種類の操作を検出できる多目的ビデオ法医学ネットワークである。
我々のネットワークは、ファルシファイドビデオの空間的・時間的異常を捉えた、幅広い法医学的特徴を抽出し、共同で分析する。
- 参考スコア(独自算出の注目度): 9.179652505898332
- License:
- Abstract: While videos can be falsified in many different ways, most existing forensic networks are specialized to detect only a single manipulation type (e.g. deepfake, inpainting). This poses a significant issue as the manipulation used to falsify a video is not known a priori. To address this problem, we propose MVFNet - a multipurpose video forensics network capable of detecting multiple types of manipulations including inpainting, deepfakes, splicing, and editing. Our network does this by extracting and jointly analyzing a broad set of forensic feature modalities that capture both spatial and temporal anomalies in falsified videos. To reliably detect and localize fake content of all shapes and sizes, our network employs a novel Multi-Scale Hierarchical Transformer module to identify forensic inconsistencies across multiple spatial scales. Experimental results show that our network obtains state-of-the-art performance in general scenarios where multiple different manipulations are possible, and rivals specialized detectors in targeted scenarios.
- Abstract(参考訳): ビデオは様々な方法で偽造されるが、既存の法医学的ネットワークの多くは、単一の操作タイプ(ディープフェイク、インペイントなど)のみを検出するために特化されている。
これは、ビデオを偽造するために使用される操作がプリオリを知らないため、重大な問題を引き起こす。
この問題に対処するために,インペイント,ディープフェイク,スプライシング,編集など,複数種類の操作を検出可能な多目的ビデオフォサイシクスネットワークであるMVFNetを提案する。
我々のネットワークは、ファルシファイドビデオの空間的・時間的異常を捉えた、幅広い法医学的特徴を抽出し、共同で分析する。
ネットワークは,すべての形状や大きさの偽コンテンツを確実に検出・ローカライズするために,複数の空間スケールにまたがる法医学的不整合を識別するために,新しいマルチスケール階層トランスフォーマモジュールを採用している。
実験により,複数の異なる操作が可能となる一般的なシナリオにおいて,ネットワークが最先端の性能を得ることを示すとともに,対象シナリオにおける特殊検出器と競合することを示す。
関連論文リスト
- AVTENet: Audio-Visual Transformer-based Ensemble Network Exploiting
Multiple Experts for Video Deepfake Detection [53.448283629898214]
近年の超現実的なディープフェイクビデオの普及は、オーディオと視覚の偽造の脅威に注意を向けている。
AI生成のフェイクビデオの検出に関するこれまでのほとんどの研究は、視覚的モダリティまたはオーディオ的モダリティのみを使用していた。
音響操作と視覚操作の両方を考慮したAVTENet(Audio-Visual Transformer-based Ensemble Network)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-19T19:01:26Z) - MMNet: Multi-Collaboration and Multi-Supervision Network for Sequential
Deepfake Detection [81.59191603867586]
シークエンシャルディープフェイク検出は、回復のための正しいシーケンスで偽の顔領域を特定することを目的としている。
偽画像の復元には、逆変換を実装するための操作モデルの知識が必要である。
顔画像の空間スケールや逐次順列化を扱うマルチコラボレーション・マルチスーパービジョンネットワーク(MMNet)を提案する。
論文 参考訳(メタデータ) (2023-07-06T02:32:08Z) - VideoFACT: Detecting Video Forgeries Using Attention, Scene Context, and
Forensic Traces [16.961763354456618]
多様なビデオの偽造や操作を検知し、ローカライズできる新しいネットワークを提案する。
以上の結果から,画像鑑定ネットワークはビデオ中の偽コンテンツをほとんど特定できないことが示唆された。
論文 参考訳(メタデータ) (2022-11-28T21:03:54Z) - Multimodal Graph Learning for Deepfake Detection [10.077496841634135]
既存のディープフェイク検出器は、堅牢性と一般化を達成する上でいくつかの課題に直面している。
本稿では,マルチモーダルグラフ学習(MGL)という新しいフレームワークを提案する。
提案手法は,ディープフェイク検出のための特徴を効果的に識別し,活用することを目的としている。
論文 参考訳(メタデータ) (2022-09-12T17:17:49Z) - Towards Unconstrained Audio Splicing Detection and Localization with Neural Networks [6.570712059945705]
同一人物の様々な音声サンプルを組み合わせることで、拘束フォージェリーを作成することができる。
オーディオスプライシングの既存の検出アルゴリズムは手作りの機能を使用し、特定の仮定を行う。
本研究では,検出とローカライゼーションをスプライシングするTransformer sequence-to-sequence (seq2seq) ネットワークを提案する。
論文 参考訳(メタデータ) (2022-07-29T13:57:16Z) - Audio-Visual Person-of-Interest DeepFake Detection [77.04789677645682]
本研究の目的は、現実世界で遭遇する様々な操作方法やシナリオに対処できるディープフェイク検出器を提案することである。
我々は、対照的な学習パラダイムを活用して、各アイデンティティに対して最も識別しやすい、移動面と音声セグメントの埋め込みを学習する。
本手法は,シングルモダリティ(オーディオのみ,ビデオのみ)とマルチモダリティ(オーディオビデオ)の両方を検出でき,低品質・低画質ビデオに対して堅牢である。
論文 参考訳(メタデータ) (2022-04-06T20:51:40Z) - Finding Facial Forgery Artifacts with Parts-Based Detectors [73.08584805913813]
顔の個々の部分に焦点を絞った一連の偽造検知システムを設計する。
これらの検出器を用いて、FaceForensics++、Celeb-DF、Facebook Deepfake Detection Challengeデータセットの詳細な実験分析を行う。
論文 参考訳(メタデータ) (2021-09-21T16:18:45Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - Exposing Deep-faked Videos by Anomalous Co-motion Pattern Detection [23.08488360126588]
本研究では,ディープフェイク映像の露出に特化して設計された完全解釈可能なビデオ法則を提案する。
各種コンテンツによる映像の一般化性を高めるため,ビデオ内の複数の特定の空間的位置の時間的動きをモデル化する。
提案したコモーションパターンは,ディープフェイク映像のデータ圧縮に対して,優れた解釈性と十分なロバスト性を有する。
論文 参考訳(メタデータ) (2020-08-11T16:47:02Z) - Sharp Multiple Instance Learning for DeepFake Video Detection [54.12548421282696]
我々はDeepFakeビデオに、ビデオレベルのラベルのみを提供するが、フェイクビデオのすべての顔が操作されるわけではない部分的な顔攻撃という新しい問題を導入する。
インスタンス埋め込みからバッグ予測への直接マッピングを構築する鋭いMIL(S-MIL)を提案する。
FFPMSと広く使われているDFDCデータセットの実験により、S-MILは部分的に攻撃されたDeepFakeビデオ検出において他の手法よりも優れていることが確認された。
論文 参考訳(メタデータ) (2020-08-11T08:52:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。