論文の概要: A Self-Supervised Descriptor for Image Copy Detection
- arxiv url: http://arxiv.org/abs/2202.10261v1
- Date: Mon, 21 Feb 2022 14:25:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 08:47:57.337476
- Title: A Self-Supervised Descriptor for Image Copy Detection
- Title(参考訳): 画像コピー検出のための自己監督型ディスクリプタ
- Authors: Ed Pizzi, Sreya Dutta Roy, Sugosh Nagavara Ravindra, Priya Goyal,
Matthijs Douze
- Abstract要約: 本稿では,自己監督型コントラスト学習目標に基づくモデルであるSSCDを紹介する。
本手法は,アーキテクチャと学習目標を変更することで,コピー検出タスクに適応する。
このアプローチはエントロピー正規化項に依存し、記述子ベクトル間の一貫した分離を促進する。
- 参考スコア(独自算出の注目度): 13.624995441674642
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image copy detection is an important task for content moderation. We
introduce SSCD, a model that builds on a recent self-supervised contrastive
training objective. We adapt this method to the copy detection task by changing
the architecture and training objective, including a pooling operator from the
instance matching literature, and adapting contrastive learning to
augmentations that combine images.
Our approach relies on an entropy regularization term, promoting consistent
separation between descriptor vectors, and we demonstrate that this
significantly improves copy detection accuracy. Our method produces a compact
descriptor vector, suitable for real-world web scale applications. Statistical
information from a background image distribution can be incorporated into the
descriptor.
On the recent DISC2021 benchmark, SSCD is shown to outperform both baseline
copy detection models and self-supervised architectures designed for image
classification by huge margins, in all settings. For example, SSCD out-performs
SimCLR descriptors by 48% absolute.
- Abstract(参考訳): 画像のコピー検出はコンテンツモデレーションの重要なタスクである。
SSCDは,近年の自己監督型コントラスト学習目標に基づくモデルである。
本手法は,インスタンスマッチング文献からプール演算子を含む,アーキテクチャとトレーニング目標を変更し,コントラスト学習を画像合成の強化に適応することにより,コピー検出タスクに適応する。
提案手法は,ディスクリプタベクトル間の一貫した分離を促進するエントロピー正規化項に依存し,コピー検出精度を大幅に向上させることを示す。
本手法は実世界のwebスケールアプリケーションに適したコンパクトディスクリプタベクトルを生成する。
背景画像分布からの統計的情報を記述子に組み込むことができる。
最近のdisC2021ベンチマークでは、SSCDはベースラインコピー検出モデルと画像分類のための自己教師型アーキテクチャの両方を全ての設定で上回っている。
例えば、sscdはsimclrディスクリプタを48%絶対的に上回っている。
関連論文リスト
- CLIP Adaptation by Intra-modal Overlap Reduction [1.2277343096128712]
画像空間におけるモーダル内重なりを埋め込み表現の観点から解析する。
Google Open Imagesデータセットからサンプルのジェネリックセットに軽量アダプタをトレーニングします。
論文 参考訳(メタデータ) (2024-09-17T16:40:58Z) - Relational Self-supervised Distillation with Compact Descriptors for Image Copy Detection [4.336779198334904]
本稿では,軽量ネットワークとコンパクトディスクリプタを用いて,競争性能を実現する手法を提案する。
より小さな特徴空間におけるフレキシブルな表現のためのリレーショナル自己教師型蒸留を導入する。
DISC2021ベンチマークでは、教師と生徒のモデルとしてResNet-50とEfficientNet-B0が使用される。
論文 参考訳(メタデータ) (2024-05-28T07:49:52Z) - Boosting Few-Shot Segmentation via Instance-Aware Data Augmentation and
Local Consensus Guided Cross Attention [7.939095881813804]
少ないショットセグメンテーションは、注釈付き画像のみを提供する新しいタスクに迅速に適応できるセグメンテーションモデルをトレーニングすることを目的としている。
本稿では,対象オブジェクトの相対的サイズに基づいて,サポートイメージを拡大するIDA戦略を提案する。
提案したIDAは,サポートセットの多様性を効果的に向上し,サポートイメージとクエリイメージ間の分散一貫性を促進する。
論文 参考訳(メタデータ) (2024-01-18T10:29:10Z) - With a Little Help from your own Past: Prototypical Memory Networks for
Image Captioning [47.96387857237473]
我々は、他のトレーニングサンプルを処理しながら得られたアクティベーションに注意を向けるネットワークを考案した。
私たちのメモリは、プロトタイプベクトルの定義を通じて過去のキーと値の分布をモデル化します。
本研究では,エンコーダ・デコーダ変換器の性能を3.7 CIDErポイント向上できることを示す。
論文 参考訳(メタデータ) (2023-08-23T18:53:00Z) - Improving Human-Object Interaction Detection via Virtual Image Learning [68.56682347374422]
人間-物体相互作用(Human-Object Interaction、HOI)は、人間と物体の相互作用を理解することを目的としている。
本稿では,仮想画像学習(Virtual Image Leaning, VIL)による不均衡分布の影響を軽減することを提案する。
ラベルからイメージへの新たなアプローチであるMultiple Steps Image Creation (MUSIC)が提案され、実際の画像と一貫した分布を持つ高品質なデータセットを作成する。
論文 参考訳(メタデータ) (2023-08-04T10:28:48Z) - Revisiting Consistency Regularization for Semi-supervised Change
Detection in Remote Sensing Images [60.89777029184023]
教師付きクロスエントロピー(CE)損失に加えて、教師なしCD損失を定式化する半教師付きCDモデルを提案する。
2つの公開CDデータセットを用いて実験を行った結果,提案手法は教師付きCDの性能に近づきやすいことがわかった。
論文 参考訳(メタデータ) (2022-04-18T17:59:01Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - CSI: Novelty Detection via Contrastive Learning on Distributionally
Shifted Instances [77.28192419848901]
コントラストシフトインスタンス (CSI) という,単純かつ効果的な手法を提案する。
従来のコントラスト学習法のように,サンプルを他の例と対比することに加えて,本トレーニング手法では,サンプルを分散シフトによる拡張と対比する。
本実験は, 種々の新規検出シナリオにおける本手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-07-16T08:32:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。