論文の概要: Mining Forgery Traces from Reconstruction Error: A Weakly Supervised Framework for Multimodal Deepfake Temporal Localization
- arxiv url: http://arxiv.org/abs/2601.21458v1
- Date: Thu, 29 Jan 2026 09:35:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.702784
- Title: Mining Forgery Traces from Reconstruction Error: A Weakly Supervised Framework for Multimodal Deepfake Temporal Localization
- Title(参考訳): リコンストラクションエラーからのマイニングフォージェリートレース:マルチモーダルディープフェイク時間的局所化のための弱い監視フレームワーク
- Authors: Midou Guo, Qilin Yin, Wei Lu, Xiangyang Luo, Rui Yang,
- Abstract要約: 本稿では,再構成誤りによる偽造を識別する,弱教師付き偽造に基づく時間的局所化フレームワークを提案する。
我々のフレームワークは、本質的なパターンを学習するために、認証データのみに訓練されたMasked Autoencoder(MAE)を使用している。
本稿では,RT-Deepfakeが時間的局所化の弱化において最先端の性能を達成することを示す。
- 参考スコア(独自算出の注目度): 25.609186178759995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern deepfakes have evolved into localized and intermittent manipulations that require fine-grained temporal localization. The prohibitive cost of frame-level annotation makes weakly supervised methods a practical necessity, which rely only on video-level labels. To this end, we propose Reconstruction-based Temporal Deepfake Localization (RT-DeepLoc), a weakly supervised temporal forgery localization framework that identifies forgeries via reconstruction errors. Our framework uses a Masked Autoencoder (MAE) trained exclusively on authentic data to learn its intrinsic spatiotemporal patterns; this allows the model to produce significant reconstruction discrepancies for forged segments, effectively providing the missing fine-grained cues for localization. To robustly leverage these indicators, we introduce a novel Asymmetric Intra-video Contrastive Loss (AICL). By focusing on the compactness of authentic features guided by these reconstruction cues, AICL establishes a stable decision boundary that enhances local discrimination while preserving generalization to unseen forgeries. Extensive experiments on large-scale datasets, including LAV-DF, demonstrate that RT-DeepLoc achieves state-of-the-art performance in weakly-supervised temporal forgery localization.
- Abstract(参考訳): 現代のディープフェイクは、微粒な時間的局所化を必要とする局所化および断続的な操作へと進化してきた。
フレームレベルのアノテーションの禁止コストは、ビデオレベルのラベルにのみ依存する弱い教師付き手法を実用的に必要とします。
そこで本研究では,再構成誤りによる偽造を識別する時間的偽造局所化フレームワークRT-DeepLocを提案する。
本フレームワークでは,真正データのみを訓練したMasked Autoencoder(MAE)を用いて,その固有時空間パターンを学習する。
これらの指標を強力に活用するために、新しい非対称なビデオ内コントラシブ・ロス(AICL)を導入する。
これらの再構成手法によって導かれる真の特徴のコンパクト性に注目して、AICLは、見当たらない偽物への一般化を保ちながら、局所的な差別を高める安定した決定境界を確立する。
LAV-DFを含む大規模データセットに対する大規模な実験は、RT-DeepLocが弱い教師付き時間的偽造の局所化において最先端のパフォーマンスを達成することを示した。
関連論文リスト
- From Passive Perception to Active Memory: A Weakly Supervised Image Manipulation Localization Framework Driven by Coarse-Grained Annotations [14.0185129202898]
BoxPromptIMLは、アノテーションコストとローカライゼーションパフォーマンスのバランスをとる、新しい弱教師付きIMLフレームワークである。
ヒトの意識下記憶機構にインスパイアされた我々の特徴融合モジュールは、リアルタイムな観察手法を用いて、リコールされたパターンを積極的に文脈化するための二重誘導方式を採用している。
論文 参考訳(メタデータ) (2025-11-25T14:39:17Z) - Glocal Information Bottleneck for Time Series Imputation [70.41814118117311]
Time Series Imputationは、時間データの欠落した値を復元することを目的としている。
既存のモデルは、通常、数値(ローカル情報)の回復に焦点をあてて、ポイントワイズ復元損失を最適化する。
我々はGlocal Information Bottleneck(Glocal-IB)という新たなトレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2025-10-06T15:24:44Z) - A Multimodal Deviation Perceiving Framework for Weakly-Supervised Temporal Forgery Localization [21.13433908232578]
本研究は,時間的偽造の局所化を弱めるための枠組みを提案する。
ビデオレベルのアノテーションのみを使用して、時間的部分的な鍛造セグメントを特定することを目的としている。
大規模な実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2025-07-22T13:55:16Z) - Context-aware TFL: A Universal Context-aware Contrastive Learning Framework for Temporal Forgery Localization [60.73623588349311]
本研究では,時間的フォージェリーローカライゼーションのための共通文脈対応コントラスト学習フレームワーク (UniCaCLF) を提案する。
提案手法は教師付きコントラスト学習を利用して,異常検出による偽造瞬間の検出と同定を行う。
実物と偽物との間における特徴の識別可能性の限界をさらに押し上げるために、効率的な文脈対応コントラスト符号化を導入する。
論文 参考訳(メタデータ) (2025-06-10T06:40:43Z) - Subspace-Guided Feature Reconstruction for Unsupervised Anomaly
Localization [5.085309164633571]
監督されていない異常なローカライゼーションは工業生産において重要な役割を担っている。
最近の手法では、事前訓練されたディープニューラルネットワークを用いて、ターゲットサンプルの特徴マッチングや再構成を行う。
本稿では,アノマライゼーションのための適応的特徴近似を追求する,新しいサブスペース誘導型特徴再構成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-25T06:58:57Z) - Delving into Sequential Patches for Deepfake Detection [64.19468088546743]
近年の顔偽造技術は、ほとんど追跡不可能なディープフェイクビデオを生み出しており、悪意のある意図で活用することができる。
従来の研究では、ディープフェイク法にまたがる一般化を追求する上で、局所的な低レベルな手がかりと時間的情報の重要性が指摘されてきた。
本稿では,局所的・時間的変換をベースとしたDeepfake Detectionフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-06T16:46:30Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。