論文の概要: A Self-Supervised Descriptor for Image Copy Detection
- arxiv url: http://arxiv.org/abs/2202.10261v1
- Date: Mon, 21 Feb 2022 14:25:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 08:47:57.337476
- Title: A Self-Supervised Descriptor for Image Copy Detection
- Title(参考訳): 画像コピー検出のための自己監督型ディスクリプタ
- Authors: Ed Pizzi, Sreya Dutta Roy, Sugosh Nagavara Ravindra, Priya Goyal,
Matthijs Douze
- Abstract要約: 本稿では,自己監督型コントラスト学習目標に基づくモデルであるSSCDを紹介する。
本手法は,アーキテクチャと学習目標を変更することで,コピー検出タスクに適応する。
このアプローチはエントロピー正規化項に依存し、記述子ベクトル間の一貫した分離を促進する。
- 参考スコア(独自算出の注目度): 13.624995441674642
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image copy detection is an important task for content moderation. We
introduce SSCD, a model that builds on a recent self-supervised contrastive
training objective. We adapt this method to the copy detection task by changing
the architecture and training objective, including a pooling operator from the
instance matching literature, and adapting contrastive learning to
augmentations that combine images.
Our approach relies on an entropy regularization term, promoting consistent
separation between descriptor vectors, and we demonstrate that this
significantly improves copy detection accuracy. Our method produces a compact
descriptor vector, suitable for real-world web scale applications. Statistical
information from a background image distribution can be incorporated into the
descriptor.
On the recent DISC2021 benchmark, SSCD is shown to outperform both baseline
copy detection models and self-supervised architectures designed for image
classification by huge margins, in all settings. For example, SSCD out-performs
SimCLR descriptors by 48% absolute.
- Abstract(参考訳): 画像のコピー検出はコンテンツモデレーションの重要なタスクである。
SSCDは,近年の自己監督型コントラスト学習目標に基づくモデルである。
本手法は,インスタンスマッチング文献からプール演算子を含む,アーキテクチャとトレーニング目標を変更し,コントラスト学習を画像合成の強化に適応することにより,コピー検出タスクに適応する。
提案手法は,ディスクリプタベクトル間の一貫した分離を促進するエントロピー正規化項に依存し,コピー検出精度を大幅に向上させることを示す。
本手法は実世界のwebスケールアプリケーションに適したコンパクトディスクリプタベクトルを生成する。
背景画像分布からの統計的情報を記述子に組み込むことができる。
最近のdisC2021ベンチマークでは、SSCDはベースラインコピー検出モデルと画像分類のための自己教師型アーキテクチャの両方を全ての設定で上回っている。
例えば、sscdはsimclrディスクリプタを48%絶対的に上回っている。
関連論文リスト
- Boosting Few-Shot Segmentation via Instance-Aware Data Augmentation and
Local Consensus Guided Cross Attention [7.939095881813804]
少ないショットセグメンテーションは、注釈付き画像のみを提供する新しいタスクに迅速に適応できるセグメンテーションモデルをトレーニングすることを目的としている。
本稿では,対象オブジェクトの相対的サイズに基づいて,サポートイメージを拡大するIDA戦略を提案する。
提案したIDAは,サポートセットの多様性を効果的に向上し,サポートイメージとクエリイメージ間の分散一貫性を促進する。
論文 参考訳(メタデータ) (2024-01-18T10:29:10Z) - With a Little Help from your own Past: Prototypical Memory Networks for
Image Captioning [47.96387857237473]
我々は、他のトレーニングサンプルを処理しながら得られたアクティベーションに注意を向けるネットワークを考案した。
私たちのメモリは、プロトタイプベクトルの定義を通じて過去のキーと値の分布をモデル化します。
本研究では,エンコーダ・デコーダ変換器の性能を3.7 CIDErポイント向上できることを示す。
論文 参考訳(メタデータ) (2023-08-23T18:53:00Z) - Improving Human-Object Interaction Detection via Virtual Image Learning [68.56682347374422]
人間-物体相互作用(Human-Object Interaction、HOI)は、人間と物体の相互作用を理解することを目的としている。
本稿では,仮想画像学習(Virtual Image Leaning, VIL)による不均衡分布の影響を軽減することを提案する。
ラベルからイメージへの新たなアプローチであるMultiple Steps Image Creation (MUSIC)が提案され、実際の画像と一貫した分布を持つ高品質なデータセットを作成する。
論文 参考訳(メタデータ) (2023-08-04T10:28:48Z) - Learning to Detect Good Keypoints to Match Non-Rigid Objects in RGB
Images [7.428474910083337]
本稿では,非剛性画像対応タスクの正マッチ数を最大化するために,新しい学習キーポイント検出手法を提案する。
我々のトレーニングフレームワークは、アノテートされた画像対と予め定義された記述子抽出器をマッチングして得られる真の対応を利用して、畳み込みニューラルネットワーク(CNN)を訓練する。
実験の結果,本手法は平均整合精度で20時までに非剛体物体の実像に対して,最先端のキーポイント検出器よりも優れていた。
論文 参考訳(メタデータ) (2022-12-13T11:59:09Z) - Revisiting Consistency Regularization for Semi-supervised Change
Detection in Remote Sensing Images [60.89777029184023]
教師付きクロスエントロピー(CE)損失に加えて、教師なしCD損失を定式化する半教師付きCDモデルを提案する。
2つの公開CDデータセットを用いて実験を行った結果,提案手法は教師付きCDの性能に近づきやすいことがわかった。
論文 参考訳(メタデータ) (2022-04-18T17:59:01Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Matching Feature Sets for Few-Shot Image Classification [22.84472344406448]
セットベースの表現は本質的に、ベースクラスからの画像のよりリッチな表現を構築します。
私たちのアプローチは、SetFeatと呼ばれ、既存のエンコーダアーキテクチャに浅い自己アテンションメカニズムを組み込んでいます。
論文 参考訳(メタデータ) (2022-04-02T22:42:54Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - CSI: Novelty Detection via Contrastive Learning on Distributionally
Shifted Instances [77.28192419848901]
コントラストシフトインスタンス (CSI) という,単純かつ効果的な手法を提案する。
従来のコントラスト学習法のように,サンプルを他の例と対比することに加えて,本トレーニング手法では,サンプルを分散シフトによる拡張と対比する。
本実験は, 種々の新規検出シナリオにおける本手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-07-16T08:32:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。