論文の概要: DYMAPIA: A Multi-Domain Framework for Detecting AI-based Video Manipulation
- arxiv url: http://arxiv.org/abs/2604.24426v1
- Date: Mon, 27 Apr 2026 12:53:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:08.009126
- Title: DYMAPIA: A Multi-Domain Framework for Detecting AI-based Video Manipulation
- Title(参考訳): DYMAPIA:AIベースのビデオ操作を検出するマルチドメインフレームワーク
- Authors: Md Shohel Rana, Andrew H. Sung,
- Abstract要約: マルチドメインDeepfake検出フレームワークであるDYMAPIAを紹介する。
空間的、スペクトル的、時間的な手がかりを融合させ、視覚データの微妙な操作の痕跡を捉える。
システムは、フーリエスペクトル、局所テクスチャ記述子、エッジの不規則性、光流の整合性などの証拠を組み合わせることで、動的異常マスクを構築する。
- 参考スコア(独自算出の注目度): 2.8647133890966994
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI-generated media are advancing rapidly, raising pressing concerns for content authenticity and digital trust. We introduce DYMAPIA, a multi-domain Deepfake detection framework that fuses spatial, spectral, and temporal cues to capture subtle traces of manipulation in visual data. The system builds dynamic anomaly masks by combining evidence from Fourier spectra, local texture descriptors, edge irregularities, and optical flow consistency, which highlight tampered regions with fine spatial accuracy. These masks guide DistXCNet, a lightweight classifier distilled from Xception and optimized with depthwise separable convolutions for fast, region-focused classification. This joint design achieves state-of-the-art results, with accuracy and F1-scores exceeding 99\% on FF++, Celeb-DF, and VDFD benchmarks, while keeping the model compact enough for real-time use. Beyond outperforming existing full-frame and multidomain detectors, DYMAPIA demonstrates deployment readiness for time-critical forensic tasks, including media verification, misinformation defense, and secure content filtering.
- Abstract(参考訳): AI生成メディアは急速に進歩し、コンテンツ信頼性とデジタル信頼に対する懸念が高まっている。
視覚データの微妙な操作の痕跡を捉えるために,空間,スペクトル,時間的手がかりを融合する多領域ディープフェイク検出フレームワークであるDYMAPIAを紹介する。
このシステムは、フーリエスペクトル、局所テクスチャ記述子、エッジの不規則性、光学流の整合性といった証拠を組み合わせて、空間的精度の細かい改ざんされた領域をハイライトすることで、ダイナミックな異常マスクを構築する。
これらのマスクは、Xceptionから抽出された軽量な分類器であるDistXCNetをガイドし、高速で領域中心の分類のために深度的に分離可能な畳み込みで最適化する。
この共同設計は、FF++、Celeb-DF、VDFDベンチマークで99%を超える精度とF1スコアを達成し、モデルをリアルタイム使用に十分コンパクトに保つ。
DYMAPIAは、既存のフルフレームおよびマルチドメイン検出器よりも優れているだけでなく、メディア検証、誤情報防御、セキュアなコンテンツフィルタリングを含む、時間クリティカルな法医学的タスクに対するデプロイメントの準備性を示している。
関連論文リスト
- RAFT-MSF++: Temporal Geometry-Motion Feature Fusion for Self-Supervised Monocular Scene Flow [51.43025173196566]
単眼のシーンフロー推定は画像列から高密度な3次元動きを復元することを目的としている。
RAFT-MSF++は,時間的特徴を融合して深度とシーンフローを推定する自己教師型マルチフレームフレームワークである。
実験の結果、RAFT-MSF++はKITTI Scene Flowベンチマークで24.14%のSF-allを達成した。
論文 参考訳(メタデータ) (2026-04-21T11:32:49Z) - SIGMAE: A Spectral-Index-Guided Foundation Model for Multispectral Remote Sensing [43.39478017496301]
Masked Autoencoder (MAE) ベースの事前訓練は、マスク付き画像領域を再構成することで、一般的な特徴表現を学習する強力な能力である。
多スペクトルリモートセンシング画像へのMAEの適用は、複雑な背景、不明瞭なターゲット、マスキング中の意味的ガイダンスの欠如など、依然として困難である。
SIGMAEは、ドメイン固有のスペクトル指標を事前知識として組み込んで、動的トークンマスキングを情報領域へ導く。
論文 参考訳(メタデータ) (2026-03-08T04:55:41Z) - Multi-modal Deepfake Detection and Localization with FPN-Transformer [21.022230340898556]
FPN変換器(Feature Pyramid-Transformer)に基づくマルチモーダルディープフェイク検出およびローカライゼーションフレームワークを提案する。
マルチスケールな特徴ピラミッドは、R-TLMブロックと局所的な注意機構によって構築され、コンテキスト間の時間的依存関係の結合解析を可能にする。
我々は,IJCAI'25 DDL-AVベンチマークの試験セットに対するアプローチを評価し,最終スコア0.7535で良好な性能を示した。
論文 参考訳(メタデータ) (2025-11-11T09:33:39Z) - SpecXNet: A Dual-Domain Convolutional Network for Robust Deepfake Detection [25.04992532067041]
本稿では,堅牢なディープフェイク検出のためのデュアルドメインアーキテクチャであるSpectral Cross-Attentional Network (SpecXNet)を提案する。
修正されたXceptionNetバックボーンの上に構築され、DDFCとDFAモジュールを分離可能な畳み込みブロックに埋め込む。
本研究は,高密度・高密度深度検出における空間スペクトル学習の有効性を明らかにするものである。
論文 参考訳(メタデータ) (2025-09-26T08:51:59Z) - CAST: Cross-Attentive Spatio-Temporal feature fusion for Deepfake detection [0.0]
CNNは空間的アーティファクトのキャプチャに有効であり、Transformerは時間的不整合のモデリングに優れている。
本稿では,空間的特徴と時間的特徴を効果的に融合させるために,クロスアテンションを利用した統合CASTモデルを提案する。
我々はFaceForensics++、Celeb-DF、DeepfakeDetectionデータセットを用いてモデルの性能を評価する。
論文 参考訳(メタデータ) (2025-06-26T18:51:17Z) - FAME: A Lightweight Spatio-Temporal Network for Model Attribution of Face-Swap Deepfakes [9.462613446025001]
フェイスフェイクのDeepfakeビデオは、デジタルセキュリティ、プライバシー、メディアの整合性へのリスクが高まる。
FAMEは、異なる顔生成モデルに特有の微妙なアーティファクトをキャプチャするために設計されたフレームワークである。
結果は、FAMEが既存のメソッドを精度と実行時の両方で一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-06-13T05:47:09Z) - Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。
提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-12T03:31:29Z) - Delving into Sequential Patches for Deepfake Detection [64.19468088546743]
近年の顔偽造技術は、ほとんど追跡不可能なディープフェイクビデオを生み出しており、悪意のある意図で活用することができる。
従来の研究では、ディープフェイク法にまたがる一般化を追求する上で、局所的な低レベルな手がかりと時間的情報の重要性が指摘されてきた。
本稿では,局所的・時間的変換をベースとしたDeepfake Detectionフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-06T16:46:30Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - DS-Net: Dynamic Spatiotemporal Network for Video Salient Object
Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。
提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-09T06:42:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。