論文の概要: Loupe: A Generalizable and Adaptive Framework for Image Forgery Detection
- arxiv url: http://arxiv.org/abs/2506.16819v1
- Date: Fri, 20 Jun 2025 08:18:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.379323
- Title: Loupe: A Generalizable and Adaptive Framework for Image Forgery Detection
- Title(参考訳): Loupe:イメージ偽造検出のための汎用的で適応的なフレームワーク
- Authors: Yuchu Jiang, Jiaming Chu, Jian Zhao, Xin Zhang, Xu Yang, Lei Jin, Chi Zhang, Xuelong Li,
- Abstract要約: 本稿では,共同深度検出と局所化のための軽量かつ効果的なフレームワークであるLoupeを提案する。
Loupeは、パッチ対応分類器と条件付きクエリとセグメンテーションモジュールを統合し、同時にグローバルな認証分類ときめ細かいマスク予測を可能にする。
提案したパッチレベルの融合および条件付きクエリ設計の有効性は,様々な偽造パターンの下での分類精度と空間的局所化の改善に有効である。
- 参考スコア(独自算出の注目度): 46.442787348123126
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The proliferation of generative models has raised serious concerns about visual content forgery. Existing deepfake detection methods primarily target either image-level classification or pixel-wise localization. While some achieve high accuracy, they often suffer from limited generalization across manipulation types or rely on complex architectures. In this paper, we propose Loupe, a lightweight yet effective framework for joint deepfake detection and localization. Loupe integrates a patch-aware classifier and a segmentation module with conditional queries, allowing simultaneous global authenticity classification and fine-grained mask prediction. To enhance robustness against distribution shifts of test set, Loupe introduces a pseudo-label-guided test-time adaptation mechanism by leveraging patch-level predictions to supervise the segmentation head. Extensive experiments on the DDL dataset demonstrate that Loupe achieves state-of-the-art performance, securing the first place in the IJCAI 2025 Deepfake Detection and Localization Challenge with an overall score of 0.846. Our results validate the effectiveness of the proposed patch-level fusion and conditional query design in improving both classification accuracy and spatial localization under diverse forgery patterns. The code is available at https://github.com/Kamichanw/Loupe.
- Abstract(参考訳): 生成モデルの普及は、視覚的コンテンツ偽造に対する深刻な懸念を引き起こしている。
既存のディープフェイク検出手法は主に画像レベルの分類または画素単位のローカライゼーションをターゲットにしている。
高い精度を達成するものもあれば、操作タイプにまたがる限定的な一般化や複雑なアーキテクチャへの依存に悩まされるものもある。
本稿では,共同深度検出と局所化のための軽量かつ効果的なフレームワークであるLoupeを提案する。
Loupeは、パッチ対応分類器と条件付きクエリとセグメンテーションモジュールを統合し、同時にグローバルな認証分類ときめ細かいマスク予測を可能にする。
テストセットの分布シフトに対する堅牢性を高めるため、ルーペはパッチレベルの予測を活用してセグメンテーションヘッドを監督する擬似ラベル誘導テスト時間適応機構を導入した。
DDLデータセットに関する大規模な実験は、Loupeが最先端のパフォーマンスを達成し、IJCAI 2025 Deepfake Detection and Localization Challengeにおいて、総合スコア0.846で第1位を確保したことを示している。
提案したパッチレベルの融合および条件付きクエリ設計の有効性は,様々な偽造パターンの下での分類精度と空間的局所化の改善に有効である。
コードはhttps://github.com/Kamichanw/Loupe.comで入手できる。
関連論文リスト
- Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。
本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。
提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - Unlocking the Hidden Potential of CLIP in Generalizable Deepfake Detection [23.48106270102081]
本稿では,顔の深部を部分的に操作して検出する課題に対処する。
我々は、Contrastive Language-Image Pre-Training(CLIP)モデル、特にViT-L/14ビジュアルエンコーダを利用する。
提案手法は,LNチューニングなどのPEFT技術を用いて,モデルのパラメータの小さな部分集合を調整する。
論文 参考訳(メタデータ) (2025-03-25T14:10:54Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - Detect Any Deepfakes: Segment Anything Meets Face Forgery Detection and
Localization [30.317619885984005]
本稿では,視覚的セグメンテーション基盤モデル,すなわちセグメンテーションモデル(SAM)をフォージェリ検出とローカライゼーションの対面に導入する。
SAMに基づいて,Multiscale Adapterを用いたDADFフレームワークを提案する。
提案するフレームワークは、エンドツーエンドのフォージェリーローカライゼーションと検出最適化をシームレスに統合する。
論文 参考訳(メタデータ) (2023-06-29T16:25:04Z) - DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection [82.8662802404075]
既存のディープフェイク検出方法は、目に見えない、または劣化したサンプルに対してうまく一般化できない。
高レベルのセマンティクスは、一般化可能な偽造検出に必要なレシピである。
DeepFake-Adapterは、DeepFake検出のためのパラメータ効率の高い最初のチューニング手法である。
論文 参考訳(メタデータ) (2023-06-01T16:23:22Z) - TruFor: Leveraging all-round clues for trustworthy image forgery
detection and localization [17.270110456445806]
TruForは、さまざまなイメージ操作方法に適用可能な、法医学的なフレームワークである。
変換器をベースとした融合アーキテクチャにより,高レベルのトレースと低レベルのトレースの両方を抽出する。
当社の手法は,安価なフェイクとディープフェイク操作の両方を確実に検出し,ローカライズすることができる。
論文 参考訳(メタデータ) (2022-12-21T11:49:43Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。