論文の概要: On the Unreasonable Effectiveness of Centroids in Image Retrieval
- arxiv url: http://arxiv.org/abs/2104.13643v1
- Date: Wed, 28 Apr 2021 08:57:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-29 12:48:06.662780
- Title: On the Unreasonable Effectiveness of Centroids in Image Retrieval
- Title(参考訳): 画像検索におけるcentroidsの不合理な効果について
- Authors: Mikolaj Wieczorek, Barbara Rychalska, Jacek Dabrowski
- Abstract要約: 本稿では,トレーニングと検索の両方において,平均セントロイド表現を用いることを提案する。
各クラスは単一の埋め込み – クラスセントロイド – で表現されるため、検索時間とストレージ要件の両方が大幅に削減される。
- 参考スコア(独自算出の注目度): 0.1933681537640272
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image retrieval task consists of finding similar images to a query image from
a set of gallery (database) images. Such systems are used in various
applications e.g. person re-identification (ReID) or visual product search.
Despite active development of retrieval models it still remains a challenging
task mainly due to large intra-class variance caused by changes in view angle,
lighting, background clutter or occlusion, while inter-class variance may be
relatively low. A large portion of current research focuses on creating more
robust features and modifying objective functions, usually based on Triplet
Loss. Some works experiment with using centroid/proxy representation of a class
to alleviate problems with computing speed and hard samples mining used with
Triplet Loss. However, these approaches are used for training alone and
discarded during the retrieval stage. In this paper we propose to use the mean
centroid representation both during training and retrieval. Such an aggregated
representation is more robust to outliers and assures more stable features. As
each class is represented by a single embedding - the class centroid - both
retrieval time and storage requirements are reduced significantly. Aggregating
multiple embeddings results in a significant reduction of the search space due
to lowering the number of candidate target vectors, which makes the method
especially suitable for production deployments. Comprehensive experiments
conducted on two ReID and Fashion Retrieval datasets demonstrate effectiveness
of our method, which outperforms the current state-of-the-art. We propose
centroid training and retrieval as a viable method for both Fashion Retrieval
and ReID applications.
- Abstract(参考訳): 画像検索タスクは、一連のギャラリー(データベース)イメージからクエリ画像と類似した画像を見つけることで構成される。
このようなシステムは、様々なアプリケーションで使われる。
person re-identification (ReID) または visual product search。
検索モデルの開発は活発に行われているが、視角、照明、背景のぼやけ、閉塞などの変化によるクラス内ばらつきが大きく、クラス間のばらつきが比較的低いため、依然として困難な課題である。
現在の研究の大部分は、より堅牢な機能の作成と、通常トリプルトロスに基づく客観的機能の変更に焦点を当てている。
いくつかの研究は、クラスのcentroid/proxy表現を使用して、計算速度と三重項損失を伴うハードサンプルマイニングの問題を軽減する実験を行っている。
しかし、これらのアプローチは単独で訓練に使われ、検索段階で廃棄される。
本稿では,トレーニングと検索の両方において,平均セントロイド表現を用いることを提案する。
このような集約表現は、外れ値に対してより堅牢であり、より安定した特徴を保証する。
各クラスは単一の埋め込み – クラスセントロイド – で表現されるため、検索時間とストレージ要件の両方が大幅に削減される。
複数の埋め込みを集約することで、候補のターゲットベクトルの数を減少させることで、検索スペースが大幅に削減される。
ReIDとFashion Retrievalの2つのデータセットで実施した総合的な実験により,提案手法の有効性が示された。
本稿では,Fashion Retrieval と ReID の両方に適用可能な手法として,セントロイドトレーニングと検索を提案する。
関連論文リスト
- Advancing Image Retrieval with Few-Shot Learning and Relevance Feedback [5.770351255180495]
Image Retrieval with Relevance Feedback (IRRF) は、検索プロセス中に反復的なヒューマンインタラクションを伴う。
本稿では,タスクに適したハイパーネットワークに基づく新しいスキームを提案し,ユーザフィードバックの迅速な調整を容易にする。
提案手法は,数発の1クラス分類でSoTAを達成でき,数発のオープンセット認識のバイナリ分類タスクで同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2023-12-18T10:20:28Z) - Two Approaches to Supervised Image Segmentation [55.616364225463066]
本研究は、深層学習とマルチセットニューロンのアプローチの比較実験を開発する。
ディープラーニングアプローチは、画像セグメンテーションの実行の可能性を確認した。
代替のマルチセット手法では、計算資源をほとんど必要とせずに精度を向上することができた。
論文 参考訳(メタデータ) (2023-07-19T16:42:52Z) - A Triplet-loss Dilated Residual Network for High-Resolution
Representation Learning in Image Retrieval [0.0]
ローカライゼーションなどのいくつかのアプリケーションでは、画像検索が最初のステップとして使用される。
本論文では,トレーニング可能なパラメータが少ない,単純かつ効率的な画像検索システムを提案する。
提案手法は三重項損失を有する拡張残差畳み込みニューラルネットワークの利点である。
論文 参考訳(メタデータ) (2023-03-15T07:01:44Z) - Real-World Image Super-Resolution by Exclusionary Dual-Learning [98.36096041099906]
実世界の画像超解像は,高品質な画像を得るための実用的な画像復元問題である。
深層学習に基づく手法は、現実世界の超解像データセットの復元に期待できる品質を実現している。
本稿では,RWSR-EDL(Real-World Image Super-Resolution by Exclusionary Dual-Learning)を提案する。
論文 参考訳(メタデータ) (2022-06-06T13:28:15Z) - Where Does the Performance Improvement Come From? - A Reproducibility
Concern about Image-Text Retrieval [85.03655458677295]
画像テキスト検索は、情報検索分野において、徐々に主要な研究方向になりつつある。
まず、画像テキスト検索タスクに焦点が当てられている理由と関連性について検討する。
本研究では,事前学習と非事前学習による検索モデルの再現の諸側面を解析する。
論文 参考訳(メタデータ) (2022-03-08T05:01:43Z) - Cross-Modality Sub-Image Retrieval using Contrastive Multimodal Image
Representations [3.3754780158324564]
異なるモダリティによってキャプチャされた類似(または同じ)コンテンツのイメージは、共通の構造をほとんど共有しないため、モダリティ間の画像検索は困難である。
本稿では,モダリティ間の逆(サブ)画像検索のためのアプリケーション非依存のコンテンツベース画像検索システムを提案する。
論文 参考訳(メタデータ) (2022-01-10T19:04:28Z) - Image-Level or Object-Level? A Tale of Two Resampling Strategies for
Long-Tailed Detection [114.00301664929911]
複数のクラスが1つの画像に存在する可能性があるため,ロングテール検出は分類と異なる。
動的でエピソードなメモリバンクに基づくオブジェクト中心のメモリリプレイ戦略を導入する。
本手法は、LVIS v0.5における最先端の長尾検出およびセグメンテーション法を様々なバックボーンにまたがる。
論文 参考訳(メタデータ) (2021-04-12T17:58:30Z) - Tasks Integrated Networks: Joint Detection and Retrieval for Image
Search [99.49021025124405]
多くの現実世界の探索シナリオ(例えばビデオ監視)では、オブジェクトは正確に検出または注釈付けされることはめったにない。
まず、エンド・ツー・エンド統合ネット(I-Net)を紹介します。
さらに,2つの新しいコントリビューションを行うDC-I-Netという改良されたI-Netを提案する。
論文 参考訳(メタデータ) (2020-09-03T03:57:50Z) - Discriminative Residual Analysis for Image Set Classification with
Posture and Age Variations [27.751472312581228]
識別残差分析(DRA)は分類性能を向上させるために提案される。
DRAは、残差表現を識別部分空間にキャストする強力な射影を得ようとする。
2つの正則化アプローチは、可能な小さなサンプルサイズ問題に対処するために使用される。
論文 参考訳(メタデータ) (2020-08-23T08:53:06Z) - One-Shot Image Classification by Learning to Restore Prototypes [11.448423413463916]
ワンショット画像分類は、カテゴリ毎に1つの画像しか持たないデータセット上で、イメージ分類器を訓練することを目的としている。
ワンショット学習では、既存のメトリック学習アプローチは、単一のトレーニングイメージがクラスを代表するものではない可能性があるため、パフォーマンスが低下する。
本稿では,RestoreNet で表される単純な回帰モデルを提案する。画像特徴のクラス変換を学習し,特徴空間のクラス中心に画像を移動させる。
論文 参考訳(メタデータ) (2020-05-04T02:11:30Z) - Unsupervised Person Re-identification via Softened Similarity Learning [122.70472387837542]
人物再識別(re-ID)はコンピュータビジョンにおいて重要なトピックである。
本稿では,ラベル付き情報を必要としないre-IDの教師なし設定について検討する。
2つの画像ベースおよびビデオベースデータセットの実験は、最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-04-07T17:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。