Fugu-MT 論文翻訳(概要): SurFITR: A Dataset for Surveillance Image Forgery Detection and Localisation

論文の概要: SurFITR: A Dataset for Surveillance Image Forgery Detection and Localisation

arxiv url: http://arxiv.org/abs/2604.07101v1
Date: Wed, 08 Apr 2026 13:55:02 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-09 17:30:51.567544
Title: SurFITR: A Dataset for Surveillance Image Forgery Detection and Localisation
Title（参考訳）: SurFITR:Surveillance Image Forgery DetectionとLocalizationのためのデータセット
Authors: Qizhou Wang, Guansong Pang, Christopher Leckie,
Abstract要約: 我々はSurFITR(Surveillance Forgery Image Test Range)を紹介する。 SurFITRは、監視スタイルの画像偽造検出とローカライゼーションのためのデータセットである。 137k以上の改ざんされた画像が含まれており、解像度や編集の種類も様々である。
参考スコア（独自算出の注目度）: 39.55678505740112
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present the Surveillance Forgery Image Test Range (SurFITR), a dataset for surveillance-style image forgery detection and localisation, in response to recent advances in open-access image generation models that raise concerns about falsifying visual evidence. Existing forgery models, trained on datasets with full-image synthesis or large manipulated regions in object-centric images, struggle to generalise to surveillance scenarios. This is because tampering in surveillance imagery is typically localised and subtle, occurring in scenes with varied viewpoints, small or occluded subjects, and lower visual quality. To address this gap, SurFITR provides a large collection of forensically valuable imagery generated via a multimodal LLM-powered pipeline, enabling semantically aware, fine-grained editing across diverse surveillance scenes. It contains over 137k tampered images with varying resolutions and edit types, generated using multiple image editing models. Extensive experiments show that existing detectors degrade significantly on SurFITR, while training on SurFITR yields substantial improvements in both in-domain and cross-domain performance. SurFITR is publicly available on GitHub.
Abstract（参考訳）: 本稿では,視覚的証拠の偽造に関する懸念を提起するオープンアクセス画像生成モデルの最近の進歩に対応するため,監視型画像偽造検出および局所化のためのデータセットであるSurveillance Forgery Image Test Range(SurFITR)を提案する。既存のフォージェリモデルは、フルイメージ合成またはオブジェクト中心の画像の大規模な操作領域を持つデータセットに基づいてトレーニングされており、監視シナリオへの一般化に苦労している。これは、監視画像の改ざんが典型的に局所化され、微妙であり、様々な視点、小または隠蔽された被写体、視覚的品質の低いシーンで起こるためである。このギャップに対処するため、SurFITRは多モードのLLM駆動パイプラインを通じて生成される法定画像の大規模なコレクションを提供し、多様な監視シーンを横断するセマンティックに認識され、きめ細かな編集を可能にする。 137k以上の改ざんされた画像を含み、解像度や編集形式は様々で、複数の画像編集モデルを用いて生成される。大規模な実験により、既存の検出器はSurFITRで著しく劣化し、SurFITRでのトレーニングはドメイン内およびクロスドメインのパフォーマンスに大きな改善をもたらすことが示された。 SurFITRはGitHubで公開されている。

関連論文リスト

Unsupervised Multi-View Visual Anomaly Detection via Progressive Homography-Guided Alignment [14.782512101141016]
多視点画像からの教師なし視覚異常検出は重要な課題である。 ViewSense-AD (VSAD) は、ビュー間の幾何学的一貫性を明示的にモデル化することで、視点不変表現を学習する。拡散モデルから得られた多レベル特徴を、通常のプロトタイプの学習メモリバンクと比較することにより異常検出を行う。
論文参考訳（メタデータ） (2025-11-24T05:01:16Z)
Cross-Spectral Body Recognition with Side Information Embedding: Benchmarks on LLCM and Analyzing Range-Induced Occlusions on IJB-MDF [51.36007967653781]
ViT(Vision Transformers)は、顔や身体の認識を含む幅広い生体計測タスクにおいて、印象的なパフォーマンスを誇示している。本研究では、視認性(VIS)画像に事前訓練されたVTモデルを、クロススペクトル体認識の難しい問題に適用する。このアイデアに基づいて、我々はSide Information Embedding (SIE)を統合し、ドメインとカメラ情報のエンコーディングの影響を調べ、スペクトル間マッチングを強化する。驚くべきことに、我々の結果は、ドメイン情報を明示的に組み込むことなく、カメラ情報のみを符号化することで、LLCMデータセット上で最先端のパフォーマンスが得られることを示している。
論文参考訳（メタデータ） (2025-06-10T16:20:52Z)
Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach [69.01456182499486]
textbfBR-Genは、さまざまなシーン認識アノテーションを備えた15万のローカル鍛造イメージの大規模なデータセットである。 textbfNFA-ViTはノイズ誘導フォージェリ増幅ビジョン変換器で、ローカライズされたフォージェリの検出を強化する。
論文参考訳（メタデータ） (2025-04-16T09:57:23Z)
Towards Robust GAN-generated Image Detection: a Multi-view Completion Representation [27.483031588071942]
GAN生成画像検出は、ディープフェイクのようなマシン合成画像操作の悪意ある使用に対する最初の防御線となっている。本稿では,新しい多視点画像補完表現に基づくロバスト検出フレームワークを提案する。我々は,6つのGANに対して異なる解像度でフレームワークの一般化能力を評価し,その幅広い摂動攻撃に対する堅牢性を評価する。
論文参考訳（メタデータ） (2023-06-02T08:38:02Z)
Sketched Multi-view Subspace Learning for Hyperspectral Anomalous Change Detection [12.719327447589345]
異常変化検出のためのスケッチ付きマルチビューサブスペース学習モデルを提案する。提案モデルでは,画像ペアからの主要な情報を保存し,計算複雑性を向上させる。実験は、ベンチマークハイパースペクトルリモートセンシングデータセットと自然なハイパースペクトルデータセットで実施される。
論文参考訳（メタデータ） (2022-10-09T14:08:17Z)
ObjectFormer for Image Manipulation Detection and Localization [118.89882740099137]
画像操作の検出とローカライズを行うObjectFormerを提案する。画像の高周波特徴を抽出し,マルチモーダルパッチの埋め込みとしてRGB特徴と組み合わせる。各種データセットについて広範な実験を行い,提案手法の有効性を検証した。
論文参考訳（メタデータ） (2022-03-28T12:27:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。