論文の概要: Tracing Copied Pixels and Regularizing Patch Affinity in Copy Detection
- arxiv url: http://arxiv.org/abs/2602.17484v1
- Date: Thu, 19 Feb 2026 15:54:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:29.193195
- Title: Tracing Copied Pixels and Regularizing Patch Affinity in Copy Detection
- Title(参考訳): コピー検出における画素追跡と正規化パッチ親和性
- Authors: Yichen Lu, Siwei Nie, Minlong Lu, Xudong Yang, Xiaobo Zhang, Peng Zhang,
- Abstract要約: 画像コピー検出(ICD)は、画像ペア間の操作されたコンテンツを、頑健な特徴表現学習によって識別することを目的としている。
自己教師付き学習(SSL)は高度なICDシステムを備えているが、既存のビューレベルのコントラスト法は、微粒な対応学習が不十分なため、洗練された編集に苦慮している。
この制限には、2つの重要な革新を通じて、編集コンテンツに固有の幾何学的トレーサビリティを活用することで対処する。
まず、PixTrace - 編集変換間の空間マッピングを明示的に維持するピクセル座標追跡モジュールを提案する。第2に、PixTraceの重なり比を用いてパッチ親和性を規則化する幾何学的ガイド付きコントラスト損失であるCopyNCEを導入する。
- 参考スコア(独自算出の注目度): 18.02051625335591
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image Copy Detection (ICD) aims to identify manipulated content between image pairs through robust feature representation learning. While self-supervised learning (SSL) has advanced ICD systems, existing view-level contrastive methods struggle with sophisticated edits due to insufficient fine-grained correspondence learning. We address this limitation by exploiting the inherent geometric traceability in edited content through two key innovations. First, we propose PixTrace - a pixel coordinate tracking module that maintains explicit spatial mappings across editing transformations. Second, we introduce CopyNCE, a geometrically-guided contrastive loss that regularizes patch affinity using overlap ratios derived from PixTrace's verified mappings. Our method bridges pixel-level traceability with patch-level similarity learning, suppressing supervision noise in SSL training. Extensive experiments demonstrate not only state-of-the-art performance (88.7% uAP / 83.9% RP90 for matcher, 72.6% uAP / 68.4% RP90 for descriptor on DISC21 dataset) but also better interpretability over existing methods.
- Abstract(参考訳): 画像コピー検出(ICD)は、画像ペア間の操作されたコンテンツを、頑健な特徴表現学習によって識別することを目的としている。
自己教師付き学習(SSL)は高度なICDシステムを備えているが、既存のビューレベルのコントラスト法は、微粒な対応学習が不十分なため、洗練された編集に苦慮している。
この制限には、2つの重要な革新を通じて、編集コンテンツに固有の幾何学的トレーサビリティを活用することで対処する。
まず、編集変換間の空間マッピングを明示的に維持するピクセル座標追跡モジュールPixTraceを提案する。
第2に、PixTraceの検証された写像から得られた重なり比を用いてパッチ親和性を正則化する幾何学的ガイド付きコントラスト損失であるCopyNCEを導入する。
本手法はパッチレベルの類似性学習で画素レベルのトレーサビリティをブリッジし,SSLトレーニングにおける監視ノイズを抑制する。
大規模な実験では、最先端のパフォーマンス(マッカーの88.7% uAP / 83.9% RP90、DEC21データセットのディスクリプタの72.6% uAP / 68.4% RP90)だけでなく、既存の手法よりも優れた解釈可能性を示している。
関連論文リスト
- Text to Image for Multi-Label Image Recognition with Joint Prompt-Adapter Learning [69.33115351856785]
本稿では,PEFTのテキストキャプションのみを使用する場合のモダリティギャップ問題に対処するため,T2I-PALと呼ばれる新しい手法を提案する。
T2I-PALの中核となる設計は、事前訓練されたテキスト-画像生成モデルを利用して、テキストキャプションからフォトリアリスティックで多様な画像を生成することである。
MS-COCO、VOC2007、NAS-WIDEを含む複数のベンチマークに対する大規模な実験は、我々のT2I-PALが認識性能を平均3.47%向上させることができることを示している。
論文 参考訳(メタデータ) (2025-06-12T11:09:49Z) - CatLIP: CLIP-level Visual Recognition Accuracy with 2.7x Faster Pre-training on Web-scale Image-Text Data [40.88256210436378]
本稿では,Web スケールの画像テキストデータに基づく視覚モデルの弱教師付き事前学習を提案する。
提案手法は,画像テキストデータに基づく事前学習を分類タスクとして再編成する。
Webスケールのデータに対する対照的な学習に比べて、トレーニング速度の2.7倍の加速を実現している。
論文 参考訳(メタデータ) (2024-04-24T05:13:28Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - UIA-ViT: Unsupervised Inconsistency-Aware Method based on Vision
Transformer for Face Forgery Detection [52.91782218300844]
そこで我々は、UIA-ViTと呼ばれるビジョン変換器に基づく教師なし不整合認識手法を提案する。
自己注意機構により、パッチ埋め込み間の注意マップは自然に一貫性関係を表現し、一貫性表現学習に適した視覚変換器となる。
論文 参考訳(メタデータ) (2022-10-23T15:24:47Z) - Towards Effective Image Manipulation Detection with Proposal Contrastive
Learning [61.5469708038966]
本稿では,効果的な画像操作検出のためのコントラスト学習(PCL)を提案する。
我々のPCLは、RGBとノイズビューから2種類のグローバル特徴を抽出し、2ストリームアーキテクチャで構成されている。
我々のPCLは、実際にラベル付けされていないデータに容易に適用でき、手作業によるラベル付けコストを削減し、より一般化可能な機能を促進することができる。
論文 参考訳(メタデータ) (2022-10-16T13:30:13Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Video Shadow Detection via Spatio-Temporal Interpolation Consistency
Training [31.115226660100294]
本稿では、ラベル付き画像とともにラベル付きビデオフレームを画像陰影検出ネットワークトレーニングに供給するフレームワークを提案する。
次に,画素ワイド分類における一般化の促進のために,空間的および時間的整合性の制約を導出する。
さらに,画像のマルチスケール影知識学習のためのスケール・アウェア・ネットワークを設計する。
論文 参考訳(メタデータ) (2022-06-17T14:29:51Z) - Unsupervised Pretraining for Object Detection by Patch Reidentification [72.75287435882798]
教師なし表現学習は、オブジェクトディテクタの事前トレーニング表現で有望なパフォーマンスを実現します。
本研究では,オブジェクト検出のための簡易かつ効果的な表現学習手法であるパッチ再識別(Re-ID)を提案する。
私たちの方法は、トレーニングの反復やデータパーセンテージなど、すべての設定でCOCOの同等を大幅に上回ります。
論文 参考訳(メタデータ) (2021-03-08T15:13:59Z) - Code-Aligned Autoencoders for Unsupervised Change Detection in
Multimodal Remote Sensing Images [18.133760118780128]
畳み込み型オートエンコーダを用いた画像翻訳は、最近、バイテンポラル衛星画像におけるマルチモーダル変化検出のアプローチとして使われている。
主な課題は、変換関数の学習に対する変更画素の寄与を減らすことで、コード空間のアライメントである。
本稿では,ドメイン固有親和性行列が入力時に取得した関係画素情報を抽出し,これを用いてコード空間のアライメントを強制する手法を提案する。
論文 参考訳(メタデータ) (2020-04-15T11:24:51Z) - Detecting Lane and Road Markings at A Distance with Perspective
Transformer Layers [5.033948921121557]
既存の手法では、検出精度は距離の増大とともに劣化することが多い。
これは、遠車線や道路標識が画像中の少数のピクセルを占有しているためである。
逆のパースペクティブマッピングは、パースペクティブの歪みを取り除くために使用できるが、本質的にはアーティファクトに繋がる可能性がある。
論文 参考訳(メタデータ) (2020-03-19T03:22:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。