論文の概要: Morphology-optimized Multi-Scale Fusion: Combining Local Artifacts and Mesoscopic Semantics for Deepfake Detection and Localization
- arxiv url: http://arxiv.org/abs/2509.13776v1
- Date: Wed, 17 Sep 2025 07:46:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.766974
- Title: Morphology-optimized Multi-Scale Fusion: Combining Local Artifacts and Mesoscopic Semantics for Deepfake Detection and Localization
- Title(参考訳): 局所アーティファクトとメソスコピック・セマンティクスを組み合わせた形態最適化多スケール核融合
- Authors: Chao Shuai, Gaojian Wang, Kun Pan, Tong Wu, Fanli Jin, Haohan Tan, Mengxiang Li, Zhenguang Liu, Feng Lin, Kui Ren,
- Abstract要約: 一般的な戦略は、操作されたイメージとともに、モデルトレーニング中に偽のリージョンアノテーションを組み込むことである。
本研究では,局所的視点と大域的視点の両方を用いて操作された領域を独立に予測する手法を提案する。
- 参考スコア(独自算出の注目度): 30.871239863769404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While the pursuit of higher accuracy in deepfake detection remains a central goal, there is an increasing demand for precise localization of manipulated regions. Despite the remarkable progress made in classification-based detection, accurately localizing forged areas remains a significant challenge. A common strategy is to incorporate forged region annotations during model training alongside manipulated images. However, such approaches often neglect the complementary nature of local detail and global semantic context, resulting in suboptimal localization performance. Moreover, an often-overlooked aspect is the fusion strategy between local and global predictions. Naively combining the outputs from both branches can amplify noise and errors, thereby undermining the effectiveness of the localization. To address these issues, we propose a novel approach that independently predicts manipulated regions using both local and global perspectives. We employ morphological operations to fuse the outputs, effectively suppressing noise while enhancing spatial coherence. Extensive experiments reveal the effectiveness of each module in improving the accuracy and robustness of forgery localization.
- Abstract(参考訳): ディープフェイク検出における高精度の追求は依然として中心的な目標であるが、操作された領域の正確な局所化に対する需要が高まっている。
分類に基づく検出において顕著な進歩があったにも拘わらず、厳密な位置決めは重要な課題である。
一般的な戦略は、操作されたイメージとともに、モデルトレーニング中に偽のリージョンアノテーションを組み込むことである。
しかし、そのようなアプローチは、局所的な詳細と大域的な意味的文脈の相補的な性質を無視することが多く、その結果、準最適局所化性能が生じる。
さらに、しばしば見過ごされる側面は、局所的な予測とグローバルな予測の融合戦略である。
両方のブランチからの出力をネーティブに組み合わせることで、ノイズやエラーが増幅され、ローカライゼーションの有効性が損なわれる。
これらの課題に対処するため,我々は,局所的視点とグローバル的視点の両方を用いて,独立して操作された領域を予測する新しいアプローチを提案する。
我々は,空間的コヒーレンスを高めつつ,音を効果的に抑制する形態的操作を用いて出力を融合する。
大規模な実験により、各モジュールがフォージェリーローカライゼーションの精度と堅牢性を向上させる効果が示された。
関連論文リスト
- Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detection [50.343419243749054]
異常検出は、医学診断や工業的欠陥検出などの分野において重要である。
CLIPの粗粒化画像テキストアライメントは、微粒化異常に対する局所化と検出性能を制限する。
クレーンは最先端のZSADを2%から28%に改善し、画像レベルとピクセルレベルの両方で、推論速度では競争力を維持している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - Dual Frequency Branch Framework with Reconstructed Sliding Windows Attention for AI-Generated Image Detection [12.523297358258345]
GAN(Generative Adversarial Networks)と拡散モデルにより、高度にリアルな合成画像の作成が可能になった。
GAN(Generative Adversarial Networks)と拡散モデルにより、高度にリアルな合成画像の作成が可能になった。
AI生成画像の検出は、重要な課題として浮上している。
論文 参考訳(メタデータ) (2025-01-25T15:53:57Z) - Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - SEAL: Simultaneous Exploration and Localization in Multi-Robot Systems [0.0]
本稿では,新しい同時探索と局所化手法を提案する。
相対的なローカライゼーションのために通信グラフ最適化を行いながら、最大探索に情報融合を用いる。
広範囲なROS-Gazeboシミュレーションにおける探索および位置決め性能のショートエッジ法より優れたSEAL
論文 参考訳(メタデータ) (2023-06-22T01:27:55Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Delving into Sequential Patches for Deepfake Detection [64.19468088546743]
近年の顔偽造技術は、ほとんど追跡不可能なディープフェイクビデオを生み出しており、悪意のある意図で活用することができる。
従来の研究では、ディープフェイク法にまたがる一般化を追求する上で、局所的な低レベルな手がかりと時間的情報の重要性が指摘されてきた。
本稿では,局所的・時間的変換をベースとしたDeepfake Detectionフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-06T16:46:30Z) - Extending regionalization algorithms to explore spatial process
heterogeneity [5.158953116443068]
そこで本稿では,空間状態記述のための2つの新しいアルゴリズムである2段Kモデルと2段Kモデルを提案する。
これらの結果から,3つのアルゴリズムが既存手法よりも優れている,あるいは同等の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2022-06-19T15:09:23Z) - Region-Based Semantic Factorization in GANs [67.90498535507106]
本稿では,任意の画像領域についてGAN(Generative Adversarial Networks)が学習した潜在意味を分解するアルゴリズムを提案する。
適切に定義された一般化されたレイリー商を通して、アノテーションや訓練なしにそのような問題を解く。
様々な最先端のGANモデルに対する実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-19T17:46:02Z) - Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation [62.29076080124199]
本稿では,クロスドメインオブジェクト検出のための特徴適応手法を提案する。
粗粒度では、アテンション機構を採用して前景領域を抽出し、その辺縁分布に応じて整列する。
粒度の細かい段階では、同じカテゴリのグローバルプロトタイプと異なるドメインとの距離を最小化することにより、前景の条件分布アライメントを行う。
論文 参考訳(メタデータ) (2020-03-23T13:40:06Z) - Deep Fusion of Local and Non-Local Features for Precision Landslide
Recognition [17.896249114628336]
本稿では,局所的特徴と非局所的特徴を融合して文脈問題を克服する効果的な手法を提案する。
リモートセンシングコミュニティで広く採用されているU-Netアーキテクチャを基盤として,さらに2つのモジュールを利用する。
実験により,提案手法は最先端の汎用的セマンティックセグメンテーション手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-02-20T03:18:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。