論文の概要: Relational Self-supervised Distillation with Compact Descriptors for Image Copy Detection
- arxiv url: http://arxiv.org/abs/2405.17928v5
- Date: Sat, 09 Nov 2024 16:02:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 17:14:31.473556
- Title: Relational Self-supervised Distillation with Compact Descriptors for Image Copy Detection
- Title(参考訳): 画像コピー検出のためのコンパクトディスクリプタによる自己教師付き蒸留
- Authors: Juntae Kim, Sungwon Woo, Jongho Nang,
- Abstract要約: 本稿では,軽量ネットワークとコンパクトディスクリプタを用いて,競争性能を実現する手法を提案する。
より小さな特徴空間におけるフレキシブルな表現のためのリレーショナル自己教師型蒸留を導入する。
DISC2021ベンチマークでは、教師と生徒のモデルとしてResNet-50とEfficientNet-B0が使用される。
- 参考スコア(独自算出の注目度): 4.336779198334904
- License:
- Abstract: Image copy detection is the task of detecting edited copies of any image within a reference database. While previous approaches have shown remarkable progress, the large size of their networks and descriptors remains a disadvantage, complicating their practical application. In this paper, we propose a novel method that achieves competitive performance by using a lightweight network and compact descriptors. By utilizing relational self-supervised distillation to transfer knowledge from a large network to a small network, we enable the training of lightweight networks with smaller descriptor sizes. We introduce relational self-supervised distillation for flexible representation in a smaller feature space and apply contrastive learning with a hard negative loss to prevent dimensional collapse. For the DISC2021 benchmark, ResNet-50 and EfficientNet-B0 are used as the teacher and student models, respectively, with micro average precision improving by 5.0\%/4.9\%/5.9\% for 64/128/256 descriptor sizes compared to the baseline method. The code is available at \href{https://github.com/juntae9926/RDCD}{https://github.com/juntae9926/RDCD}.
- Abstract(参考訳): 画像コピー検出は、参照データベース内の任意の画像の編集されたコピーを検出するタスクである。
これまでのアプローチは目覚ましい進歩を見せたが、ネットワークとディスクリプタの大規模化は相変わらず不利であり、実用的応用を複雑にしている。
本稿では,軽量ネットワークとコンパクトディスクリプタを用いて,競争性能を実現する手法を提案する。
大規模ネットワークから小さなネットワークへ知識を伝達するために,リレーショナル自己教師型蒸留を用いることで,より小さな記述子サイズの軽量ネットワークのトレーニングを可能にする。
より小さな特徴空間におけるフレキシブルな表現のためのリレーショナル自己教師型蒸留を導入し, 次元崩壊を防止するために, 強負損失を伴うコントラスト学習を適用した。
DISC2021ベンチマークでは、ResNet-50とEfficientNet-B0がそれぞれ教師モデルと学生モデルとして使われ、ベースライン法と比較して、64/128/256のディスクリプタサイズに対して5.0\%/4.9\%/5.9\%のマイクロ平均精度が向上した。
コードは \href{https://github.com/juntae9926/RDCD}{https://github.com/juntae9926/RDCD} で公開されている。
関連論文リスト
- Weakly Supervised LiDAR Semantic Segmentation via Scatter Image Annotation [38.715754110667916]
画像アノテーションを用いたLiDARセマンティックセマンティックセマンティックセマンティクスを実装した。
また、パフォーマンスギャップを減らすための3つの重要な戦略を含むネットワークであるScatterNetを提案する。
本手法は,完全教師付き手法の95%以上の性能を達成するために,ラベル付き点の0.02%未満を必要とする。
論文 参考訳(メタデータ) (2024-04-19T13:01:30Z) - A Self-Supervised Descriptor for Image Copy Detection [13.624995441674642]
本稿では,自己監督型コントラスト学習目標に基づくモデルであるSSCDを紹介する。
本手法は,アーキテクチャと学習目標を変更することで,コピー検出タスクに適応する。
このアプローチはエントロピー正規化項に依存し、記述子ベクトル間の一貫した分離を促進する。
論文 参考訳(メタデータ) (2022-02-21T14:25:32Z) - Manifold Regularized Dynamic Network Pruning [102.24146031250034]
本稿では,全インスタンスの多様体情報をプルーンドネットワークの空間に埋め込むことにより,冗長フィルタを動的に除去する新しいパラダイムを提案する。
提案手法の有効性をいくつかのベンチマークで検証し,精度と計算コストの両面で優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-10T03:59:03Z) - Mixed-Privacy Forgetting in Deep Networks [114.3840147070712]
大規模画像分類タスクにおいてトレーニングされたネットワークの重みからトレーニングサンプルのサブセットの影響を除去できることを示す。
そこで本研究では,混合プライバシー設定における「忘れ」という新しい概念を導入する。
提案手法は,モデル精度のトレードオフを伴わずに忘れることができることを示す。
論文 参考訳(メタデータ) (2020-12-24T19:34:56Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z) - ReMarNet: Conjoint Relation and Margin Learning for Small-Sample Image
Classification [49.87503122462432]
ReMarNet(Relation-and-Margin Learning Network)と呼ばれるニューラルネットワークを導入する。
本手法は,上記2つの分類機構の双方において優れた性能を発揮する特徴を学習するために,異なるバックボーンの2つのネットワークを組み立てる。
4つの画像データセットを用いた実験により,本手法はラベル付きサンプルの小さな集合から識別的特徴を学習するのに有効であることが示された。
論文 参考訳(メタデータ) (2020-06-27T13:50:20Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。