論文の概要: A Benchmark and Asymmetrical-Similarity Learning for Practical Image
Copy Detection
- arxiv url: http://arxiv.org/abs/2205.12358v1
- Date: Tue, 24 May 2022 20:39:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-26 14:34:12.880753
- Title: A Benchmark and Asymmetrical-Similarity Learning for Practical Image
Copy Detection
- Title(参考訳): 実用的画像コピー検出のためのベンチマークと非対称相似性学習
- Authors: Wenhao Wang, Yifan Sun, Yi Yang
- Abstract要約: 画像コピー検出(ICD)は、クエリ画像が参照セットからの任意の画像の編集されたコピーであるかどうかを判定することを目的としている。
一部のクエリは編集されたコピーではなく、本質的には参照画像と似ている。
この特徴を特徴付ける最初のICDベンチマークを構築した。
- 参考スコア(独自算出の注目度): 30.358206867280426
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Image copy detection (ICD) aims to determine whether a query image is an
edited copy of any image from a reference set. Currently, there are very
limited public benchmarks for ICD, while all overlook a critical challenge in
real-world applications, i.e., the distraction from hard negative queries.
Specifically, some queries are not edited copies but are inherently similar to
some reference images. These hard negative queries are easily false recognized
as edited copies, significantly compromising the ICD accuracy. This observation
motivates us to build the first ICD benchmark featuring this characteristic.
Based on existing ICD datasets, this paper constructs a new dataset by
additionally adding 100, 000 and 24, 252 hard negative pairs into the training
and test set, respectively. Moreover, this paper further reveals a unique
difficulty for solving the hard negative problem in ICD, i.e., there is a
fundamental conflict between current metric learning and ICD. This conflict is:
the metric learning adopts symmetric distance while the edited copy is an
asymmetric (unidirectional) process, e.g., a partial crop is close to its
holistic reference image and is an edited copy, while the latter cannot be the
edited copy of the former (in spite the distance is equally small). This
insight results in an Asymmetrical-Similarity Learning (ASL) method, which
allows the similarity in two directions (the query <-> the reference image) to
be different from each other. Experimental results show that ASL outperforms
state-of-the-art methods by a clear margin, confirming that solving the
symmetric-asymmetric conflict is critical for ICD.
- Abstract(参考訳): 画像コピー検出(ICD)は、クエリイメージが参照セットからの任意の画像の編集コピーであるかどうかを判定することを目的とする。
現在、ICDには非常に限定的な公開ベンチマークがあるが、現実のアプリケーションにおいて重要な課題、すなわちハードネガティブなクエリからの逸脱を見落としている。
具体的には、一部のクエリは編集されたコピーではなく、本質的には参照画像と似ている。
これらのハードネガティブなクエリは、編集されたコピーとして容易に誤認識され、icdの精度を著しく損なう。
この観察は、この特徴を特徴とする最初のICDベンチマークを構築する動機となります。
既存のICDデータセットに基づいて,トレーニングセットとテストセットにそれぞれ100,000,24,252の負のペアを追加することで,新たなデータセットを構築する。
さらに,本論文では,icdにおける難解な問題,すなわち,現在のメトリック学習とicdの間には根本的な矛盾があることを示す。
この矛盾は、メートル法学習が対称距離を採用する一方、編集されたコピーは非対称(一方向)のプロセスであり、例えば、部分的作物はその全体的基準画像に近く、編集されたコピーであり、後者は(距離が等しく小さいにもかかわらず)前者の編集されたコピーであることはできない。
この知見は,2方向の類似性(クエリ<->参照画像)を互いに異なるものにする,非対称相似学習(ASL)手法をもたらす。
実験の結果, ASLは最先端手法よりも明確なマージンで優れており, 対称非対称競合の解決がICDにとって重要であることが示された。
関連論文リスト
- Noisy-Correspondence Learning for Text-to-Image Person Re-identification [50.07634676709067]
本稿では,雑音対応においても頑健な視覚関係を学習するための新しいロバスト二重埋め込み法(RDE)を提案する。
提案手法は,3つのデータセット上での合成ノイズ対応と非合成ノイズ対応を両立させる。
論文 参考訳(メタデータ) (2023-08-19T05:34:13Z) - Generating Aligned Pseudo-Supervision from Non-Aligned Data for Image
Restoration in Under-Display Camera [84.41316720913785]
トレーニングデータ収集のための古典的なステレオセットアップを再考する -- 同じシーンの2つの画像を1つのUDCと1つの標準カメラでキャプチャする。
鍵となるアイデアは、高品質な参照イメージから詳細を"コピー"し、UDCイメージ上でそれらを"ペースト"することです。
トランスフォーマーベースの新しいフレームワークは、対応するUDC入力に対して、整合性はあるが高品質なターゲットデータを生成する。
論文 参考訳(メタデータ) (2023-04-12T17:56:42Z) - Revisiting Consistency Regularization for Semi-supervised Change
Detection in Remote Sensing Images [60.89777029184023]
教師付きクロスエントロピー(CE)損失に加えて、教師なしCD損失を定式化する半教師付きCDモデルを提案する。
2つの公開CDデータセットを用いて実験を行った結果,提案手法は教師付きCDの性能に近づきやすいことがわかった。
論文 参考訳(メタデータ) (2022-04-18T17:59:01Z) - A Self-Supervised Descriptor for Image Copy Detection [13.624995441674642]
本稿では,自己監督型コントラスト学習目標に基づくモデルであるSSCDを紹介する。
本手法は,アーキテクチャと学習目標を変更することで,コピー検出タスクに適応する。
このアプローチはエントロピー正規化項に依存し、記述子ベクトル間の一貫した分離を促進する。
論文 参考訳(メタデータ) (2022-02-21T14:25:32Z) - The 2021 Image Similarity Dataset and Challenge [32.202821997745716]
本稿では,大規模画像類似度検出のための新しいベンチマークを提案する。
目標は、クエリイメージが、サイズ100万の参照コーパス内の任意のイメージの修正コピーであるかどうかを決定することである。
論文 参考訳(メタデータ) (2021-06-17T17:23:59Z) - Feature Space Targeted Attacks by Statistic Alignment [74.40447383387574]
特徴空間ターゲットは、中間特徴写像を変調して摂動画像を攻撃する。
画素ワイドユークリッド距離の現在の選択は、ソースとターゲットの特徴に不合理に空間整合性制約を課すため、不一致を測定することが疑問視されている。
本稿では,Pair-wise Alignment AttackとGlobal-wise Alignment Attackという2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2021-05-25T03:46:39Z) - SSCR: Iterative Language-Based Image Editing via Self-Supervised
Counterfactual Reasoning [79.30956389694184]
反復言語ベースの画像編集(IL-BIE)タスクは、段階的に画像を編集するための反復的な命令に従う。
データ不足は、命令ベースの変更前後の大規模な画像のサンプル収集が困難であるため、ILBIEにとって重要な問題である。
本稿では,データ不足を克服する対実的思考を取り入れたセルフスーパービジョンの対実的推論フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-21T01:45:58Z) - RANSAC-Flow: generic two-stage image alignment [53.11926395028508]
単純な教師なしのアプローチは、様々なタスクにおいて驚くほどうまく機能することを示す。
その単純さにもかかわらず、我々の手法は様々なタスクやデータセットで競合する結果を示す。
論文 参考訳(メタデータ) (2020-04-03T12:37:58Z) - A Novel Inspection System For Variable Data Printing Using Deep Learning [0.9176056742068814]
超低偽アラームレート(0.005%)で可変データプリント(VDP)を検査するための新しい手法を提案する。
このシステムは、参照画像と低コストスキャナーによってキャプチャされた画像の2つの画像の比較に基づいている。
論文 参考訳(メタデータ) (2020-01-13T15:07:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。