論文の概要: Bag of Tricks and A Strong baseline for Image Copy Detection
- arxiv url: http://arxiv.org/abs/2111.08004v1
- Date: Sat, 13 Nov 2021 13:58:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 08:47:52.334602
- Title: Bag of Tricks and A Strong baseline for Image Copy Detection
- Title(参考訳): 画像コピー検出のための手技の袋と強固なベースライン
- Authors: Wenhao Wang, Weipu Zhang, Yifan Sun, Yi Yang
- Abstract要約: 画像コピー検出には,トリックの袋と強力なベースラインが提案されている。
我々は、異なるクエリのスコアを安定させるために、記述子ストレッチ戦略を設計する。
提案されたベースラインは、Facebook AI Image similarity Challenge: Descriptor Trackの参加者526人中3位である。
- 参考スコア(独自算出の注目度): 36.473577708618976
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image copy detection is of great importance in real-life social media. In
this paper, a bag of tricks and a strong baseline are proposed for image copy
detection. Unsupervised pre-training substitutes the commonly-used supervised
one. Beyond that, we design a descriptor stretching strategy to stabilize the
scores of different queries. Experiments demonstrate that the proposed method
is effective. The proposed baseline ranks third out of 526 participants on the
Facebook AI Image Similarity Challenge: Descriptor Track. The code and trained
models are available at
https://github.com/WangWenhao0716/ISC-Track2-Submission.
- Abstract(参考訳): 画像コピー検出は、実生活のソーシャルメディアにおいて非常に重要である。
本稿では,画像コピー検出のために,トリックの袋と強力なベースラインを提案する。
教師なしの事前訓練は、一般的に使用される教師なしの訓練に置き換えられる。
さらに、異なるクエリのスコアを安定化するための記述子ストレッチ戦略を設計する。
提案手法が有効であることを示す実験を行った。
提案されたベースラインは、Facebook AI Image similarity Challenge: Descriptor Trackの参加者526人中3位である。
コードとトレーニングされたモデルはhttps://github.com/WangWenhao0716/ISC-Track2-Submissionで公開されている。
関連論文リスト
- If at First You Don't Succeed, Try, Try Again: Faithful Diffusion-based
Text-to-Image Generation by Selection [53.320946030761796]
拡散ベースのテキスト・トゥ・イメージ(T2I)モデルは、テキスト・プロンプトへの忠実さを欠く可能性がある。
大規模なT2I拡散モデルは通常想定されるよりも忠実であり、複雑なプロンプトに忠実な画像を生成することができることを示す。
本稿では,テキストプロンプトの候補画像を生成するパイプラインを導入し,自動スコアリングシステムにより最適な画像を選択する。
論文 参考訳(メタデータ) (2023-05-22T17:59:41Z) - Learning to Detect Good Keypoints to Match Non-Rigid Objects in RGB
Images [7.428474910083337]
本稿では,非剛性画像対応タスクの正マッチ数を最大化するために,新しい学習キーポイント検出手法を提案する。
我々のトレーニングフレームワークは、アノテートされた画像対と予め定義された記述子抽出器をマッチングして得られる真の対応を利用して、畳み込みニューラルネットワーク(CNN)を訓練する。
実験の結果,本手法は平均整合精度で20時までに非剛体物体の実像に対して,最先端のキーポイント検出器よりも優れていた。
論文 参考訳(メタデータ) (2022-12-13T11:59:09Z) - Correlation Verification for Image Retrieval [15.823918683848877]
相関検証ネットワーク (CVNet) という新しい画像検索手法を提案する。
CVNetは、様々な画像対から多様な幾何マッチングパターンを学習しながら、高密度特徴相関を画像類似性に圧縮する。
提案するネットワークは,有意なマージンを有する複数の検索ベンチマークにおいて,最先端の性能を示す。
論文 参考訳(メタデータ) (2022-04-04T13:18:49Z) - CGUA: Context-Guided and Unpaired-Assisted Weakly Supervised Person
Search [54.106662998673514]
本稿では,コンテキストガイドとアンペア支援(CGUA)を弱教師付き人物検索フレームワークとして導入する。
具体的には、クラスタリングプロセスにおけるコンテキスト情報を活用する新しいコンテキストガイドクラスタ(CGC)アルゴリズムを提案する。
本手法は,より多様なラベル付きデータを活用することにより,最先端の教師付き手法に匹敵する,あるいは優れた性能を実現する。
論文 参考訳(メタデータ) (2022-03-27T13:57:30Z) - Contrastive Learning with Large Memory Bank and Negative Embedding
Subtraction for Accurate Copy Detection [1.90365714903665]
コピー検出は、ある画像がデータベース内の任意の画像の修正されたコピーであるかどうかを決定するタスクである。
コントラスト学習を用いて畳み込みニューラルネットワーク(CNN)を訓練した。
私たちの方法では、Facebook AI Image similarity Challenge: Descriptor Trackで1位を獲得しました。
論文 参考訳(メタデータ) (2021-12-08T15:08:10Z) - D^2LV: A Data-Driven and Local-Verification Approach for Image Copy
Detection [36.473577708618976]
画像類似性チャレンジ:マッチングトラック - NeurIPS'21で競合する、データ駆動で局所的な検証手法が提案されている。
D2LVでは、教師なし事前訓練が一般的に使用される教師付き訓練に取って代わる。
提案されたアプローチは、Facebook AI Image similarity Challenge: Matching Trackで1,103人中1位にランクインしている。
論文 参考訳(メタデータ) (2021-11-13T10:56:58Z) - Warp Consistency for Unsupervised Learning of Dense Correspondences [116.56251250853488]
密接な対応を学習する上で重要な課題は、実画像対に対する地道整合の欠如である。
密な対応回帰のための教師なし学習目標であるWarp Consistencyを提案する。
私たちのアプローチは、MegaDepth、RobotCar、TSSなど、いくつかの挑戦的なベンチマークに新しい最先端を設定します。
論文 参考訳(メタデータ) (2021-04-07T17:58:22Z) - Deep learning based registration using spatial gradients and noisy
segmentation labels [52.78503776563559]
ディープラーニングベースのアプローチは、高速かつ実行可能な登録戦略を提供することで、非常に人気を博しました。
我々の研究は(i)対称な定式化に依存し、ソースからターゲットへの変換とターゲットからソースへの変換を同時に予測し、訓練された表現を類似させる。
本手法では,タスク3では0.64ドル,テスト4では0.85ドルの平均ダイスを報告し,3位となった。
論文 参考訳(メタデータ) (2020-10-21T11:08:45Z) - A Self-supervised GAN for Unsupervised Few-shot Object Recognition [39.79912546252623]
本稿では、教師なし数発の物体認識について述べる。
すべてのトレーニングイメージはラベル付けされておらず、テストイメージはクエリと、対象のクラス毎にラベル付きサポートイメージに分割されている。
我々は,バニラGANを2つの損失関数で拡張し,それぞれが自己教師型学習を目的とした。
論文 参考訳(メタデータ) (2020-08-16T19:47:26Z) - Anomaly Detection-Based Unknown Face Presentation Attack Detection [74.4918294453537]
異常検出に基づくスプーフ攻撃検出は、顔提示攻撃検出の最近の進歩である。
本稿では,異常検出に基づくスプーフ攻撃検出のためのディープラーニングソリューションを提案する。
提案手法はCNNの表現学習能力の恩恵を受け,fPADタスクの優れた特徴を学習する。
論文 参考訳(メタデータ) (2020-07-11T21:20:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。