論文の概要: Preserving Forgery Artifacts: AI-Generated Video Detection at Native Scale
- arxiv url: http://arxiv.org/abs/2604.04634v1
- Date: Mon, 06 Apr 2026 12:36:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.188396
- Title: Preserving Forgery Artifacts: AI-Generated Video Detection at Native Scale
- Title(参考訳): 偽物の保存: ネイティブスケールでのAI生成ビデオ検出
- Authors: Zhengcen Li, Chenyang Jiang, Hang Zhao, Shiyang Zhou, Yunyang Mo, Feng Gao, Fan Yang, Qiben Shan, Shaocong Wu, Jingyong Su,
- Abstract要約: 包括的データセットと新しい検出フレームワークを導入する。
まず、最先端の15のオープンソースおよび商用ジェネレータから140Kビデオの大規模なデータセットをキュレートする。
本稿では,Qwen-VL Vision Transformer上に構築された新しい検出フレームワークを提案する。
- 参考スコア(独自算出の注目度): 36.51885181895111
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid advancement of video generation models has enabled the creation of highly realistic synthetic media, raising significant societal concerns regarding the spread of misinformation. However, current detection methods suffer from critical limitations. They rely on preprocessing operations like fixed-resolution resizing and cropping. These operations not only discard subtle, high-frequency forgery traces but also cause spatial distortion and significant information loss. Furthermore, existing methods are often trained and evaluated on outdated datasets that fail to capture the sophistication of modern generative models. To address these challenges, we introduce a comprehensive dataset and a novel detection framework. First, we curate a large-scale dataset of over 140K videos from 15 state-of-the-art open-source and commercial generators, along with Magic Videos benchmark designed specifically for evaluating ultra-realistic synthetic content. In addition, we propose a novel detection framework built on the Qwen2.5-VL Vision Transformer, which operates natively at variable spatial resolutions and temporal durations. This native-scale approach effectively preserves the high-frequency artifacts and spatiotemporal inconsistencies typically lost during conventional preprocessing. Extensive experiments demonstrate that our method achieves superior performance across multiple benchmarks, underscoring the critical importance of native-scale processing and establishing a robust new baseline for AI-generated video detection.
- Abstract(参考訳): 映像生成モデルの急速な進歩により、高度にリアルな合成メディアの作成が可能となり、誤情報の拡散に関する社会的な懸念が高まった。
しかし、現在の検出方法には限界がある。
それらは、固定解像度のリサイズやトリミングのような前処理操作に依存している。
これらの操作は、微妙で高周波の偽造跡を破棄するだけでなく、空間歪みや重要な情報損失を引き起こす。
さらに、既存の手法は、現代の生成モデルの高度化を捉えるのに失敗する時代遅れのデータセットに基づいて、しばしば訓練され、評価される。
これらの課題に対処するために、包括的データセットと新しい検出フレームワークを導入する。
まず、最先端の15のオープンソースおよび商用ジェネレータによる140K以上のビデオの大規模なデータセットと、超現実的な合成コンテンツを評価するために設計されたMagic Videosベンチマークをキュレートする。
さらに,Qwen2.5-VL Vision Transformer上に構築された新しい検出フレームワークを提案する。
このネイティブスケールのアプローチは、従来の前処理で一般的に失われる高周波アーティファクトと時空間的不整合を効果的に保存する。
大規模な実験により,本手法は複数のベンチマークにおいて優れた性能を示し,ネイティブスケール処理の重要性を強調し,AI生成ビデオ検出のための堅牢な新しいベースラインを確立する。
関連論文リスト
- Training-free Detection of Generated Videos via Spatial-Temporal Likelihoods [6.921364920053057]
トレーニング不要で理論上は正当化された検出器であるSTALLを導入し、ビデオの確率に基づくスコアを提供する。
我々は,2つの公開ベンチマーク上でSTALLを評価し,最新の生成モデルを用いた新しいベンチマークであるComGenVidを紹介する。
論文 参考訳(メタデータ) (2026-03-16T09:26:56Z) - FakeRadar: Probing Forgery Outliers to Detect Unknown Deepfake Videos [56.782373316571444]
本稿では,新しいディープフェイクビデオ検出フレームワークであるFakeRadarを提案する。
FakeRadarは、現実世界のシナリオにおけるクロスドメインの一般化の課題に対処する。
論文 参考訳(メタデータ) (2025-12-16T17:11:45Z) - Scaling Transformer-Based Novel View Synthesis Models with Token Disentanglement and Synthetic Data [53.040873127309766]
本稿では,トランスアーキテクチャ内でのトークンのアンタングル化プロセスを提案し,特徴分離を向上し,より効果的な学習を実現する。
提案手法は,データセット内およびデータセット間の評価において,既存のモデルよりも優れる。
論文 参考訳(メタデータ) (2025-09-08T17:58:06Z) - BrokenVideos: A Benchmark Dataset for Fine-Grained Artifact Localization in AI-Generated Videos [63.03271511550633]
BrokenVideosは、3,254のAI生成ビデオのベンチマークデータセットで、微妙に注釈付けされたピクセルレベルのマスクが視覚的腐敗の領域を強調している。
実験の結果,BrokenVideosにおける人工物検出モデルの訓練状況とマルチモーダル大言語モデル(MLLM)が,破壊領域のローカライズ能力を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2025-06-25T03:30:04Z) - Seeing What Matters: Generalizable AI-generated Video Detection with Forensic-Oriented Augmentation [31.737159092430108]
我々は、異なる生成的アーキテクチャを研究し、バイアスがなく、障害に対して堅牢で、モデル間で共有される差別的特徴を探索し識別する。
本稿では,ウェーブレット分解に基づく新たなデータ拡張戦略を導入し,より関連する法医学的手がかりを活用するために,特定の周波数関連帯域を置き換える。
本手法は最先端検出器よりも精度が向上し, 非常に最近の生成モデルにおいても優れた結果が得られる。
論文 参考訳(メタデータ) (2025-06-20T07:36:59Z) - AntPivot: Livestream Highlight Detection via Hierarchical Attention
Mechanism [64.70568612993416]
本稿では,Livestream Highlight Detectionという新たなタスクを定式化し,上記の課題を議論・分析し,新しいアーキテクチャAntPivotを提案する。
我々は、このタスクをインスタンス化し、我々のモデルの性能を評価するために、完全に注釈付きデータセットAntHighlightを構築した。
論文 参考訳(メタデータ) (2022-06-10T05:58:11Z) - Beyond the Spectrum: Detecting Deepfakes via Re-Synthesis [69.09526348527203]
ディープフェイク(Deepfakes)として知られる非常に現実的なメディアは、現実の目から人間の目まで区別できない。
本研究では,テスト画像を再合成し,検出のための視覚的手がかりを抽出する,新しい偽検出手法を提案する。
種々の検出シナリオにおいて,提案手法の摂動に対する有効性の向上,GANの一般化,堅牢性を示す。
論文 参考訳(メタデータ) (2021-05-29T21:22:24Z) - Coherent Loss: A Generic Framework for Stable Video Segmentation [103.78087255807482]
ビデオセグメンテーションの結果の視覚的品質を,ジッタリングアーティファクトがいかに劣化させるかを検討する。
本稿では,ニューラルネットワークの性能向上を目的とした汎用フレームワークを備えたコヒーレントロスを提案する。
論文 参考訳(メタデータ) (2020-10-25T10:48:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。