論文の概要: Improving Deep Metric Learning by Divide and Conquer
- arxiv url: http://arxiv.org/abs/2109.04003v1
- Date: Thu, 9 Sep 2021 02:57:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-11 07:01:38.857429
- Title: Improving Deep Metric Learning by Divide and Conquer
- Title(参考訳): 分割と克服によるディープメトリック学習の改善
- Authors: Artsiom Sanakoyeu, Pingchuan Ma, Vadim Tschernezki, Bj\"orn Ommer
- Abstract要約: ディープ・メトリック・ラーニング(DML)は多くのコンピュータ・ビジョン・アプリケーションの基盤となっている。
入力ドメインから埋め込み空間へのマッピングを学習することを目的としている。
埋め込み空間とデータを階層的に小さな部分に分割することで、より表現力のある表現を構築することを提案する。
- 参考スコア(独自算出の注目度): 11.380358587116683
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Deep metric learning (DML) is a cornerstone of many computer vision
applications. It aims at learning a mapping from the input domain to an
embedding space, where semantically similar objects are located nearby and
dissimilar objects far from another. The target similarity on the training data
is defined by user in form of ground-truth class labels. However, while the
embedding space learns to mimic the user-provided similarity on the training
data, it should also generalize to novel categories not seen during training.
Besides user-provided groundtruth training labels, a lot of additional visual
factors (such as viewpoint changes or shape peculiarities) exist and imply
different notions of similarity between objects, affecting the generalization
on the images unseen during training. However, existing approaches usually
directly learn a single embedding space on all available training data,
struggling to encode all different types of relationships, and do not
generalize well. We propose to build a more expressive representation by
jointly splitting the embedding space and the data hierarchically into smaller
sub-parts. We successively focus on smaller subsets of the training data,
reducing its variance and learning a different embedding subspace for each data
subset. Moreover, the subspaces are learned jointly to cover not only the
intricacies, but the breadth of the data as well. Only after that, we build the
final embedding from the subspaces in the conquering stage. The proposed
algorithm acts as a transparent wrapper that can be placed around arbitrary
existing DML methods. Our approach significantly improves upon the
state-of-the-art on image retrieval, clustering, and re-identification tasks
evaluated using CUB200-2011, CARS196, Stanford Online Products, In-shop
Clothes, and PKU VehicleID datasets.
- Abstract(参考訳): ディープメトリック学習(dml)は、多くのコンピュータビジョンアプリケーションの基礎である。
これは入力ドメインから埋め込み空間へのマッピングを学習することを目的としている。
トレーニングデータのターゲットの類似性は、ユーザによる接地ラベルによって定義される。
しかし,埋め込み空間はトレーニングデータにユーザが提供する類似性を模倣することを学ぶ一方で,トレーニング中に見られない新しいカテゴリにも一般化する必要がある。
ユーザが提供する接地訓練ラベルの他に、多くの視覚的要素(視点の変化や形状の特異性など)が存在し、オブジェクト間の類似性の異なる概念を暗示し、トレーニング中の画像の一般化に影響を与える。
しかし、既存のアプローチは通常、利用可能なすべてのトレーニングデータに単一の埋め込みスペースを直接学習し、あらゆる種類の関係をエンコードするのに苦労し、うまく一般化しない。
埋め込み空間とデータを階層的により小さな部分に分割することで,より表現力のある表現を構築することを提案する。
トレーニングデータの小さなサブセットに注目し、分散を減らし、各データサブセットに対して異なる埋め込み部分空間を学習します。
さらに、サブスペースは、複雑なだけでなく、データの幅もカバーするように、共同で学習される。
その後のみ、征服段階における部分空間から最後の埋め込みを構築します。
提案アルゴリズムは、任意の既存のDMLメソッドに配置可能な透明なラッパーとして機能する。
提案手法は,CUB200-2011,CARS196,Stanford Online Products,In-shop Clothes,PKU VehicleIDデータセットを用いて評価した画像検索,クラスタリング,再識別タスクの最先端性を大幅に向上させる。
関連論文リスト
- From Isolated Islands to Pangea: Unifying Semantic Space for Human Action Understanding [50.412121156940294]
アクション理解は、物理空間から意味空間へのマッピングとして形成することができる。
そこで本研究では,Pangeaを完全に活用するために,物理空間から意味空間への新たなモデルマッピングを提案する。
論文 参考訳(メタデータ) (2023-04-02T15:04:43Z) - DC-Former: Diverse and Compact Transformer for Person Re-Identification [38.12558570608426]
個人再識別(re-ID)タスクでは,データ不足のため,深層学習による識別表現の学習が依然として困難である。
埋め込み空間を複数の部分空間に分割することで、同様の効果を発揮できるDiverse and Compact Transformer (DC-Former)を提案する。
論文 参考訳(メタデータ) (2023-02-28T06:03:42Z) - Self-Supervised Representation Learning With MUlti-Segmental
Informational Coding (MUSIC) [6.693379403133435]
自己教師付き表現学習は、高次元データを意味のある埋め込み空間にマッピングする。
自己教師型表現学習のためのMUSIC(MUlti-Segmental Informational Coding)を提案する。
論文 参考訳(メタデータ) (2022-06-13T20:37:48Z) - Revisiting Contrastive Methods for Unsupervised Learning of Visual
Representations [78.12377360145078]
対照的な自己教師型学習は、セグメンテーションやオブジェクト検出といった多くの下流タスクにおいて教師付き事前訓練よりも優れています。
本稿では,データセットのバイアスが既存手法にどのように影響するかを最初に検討する。
現在のコントラストアプローチは、(i)オブジェクト中心対シーン中心、(ii)一様対ロングテール、(iii)一般対ドメイン固有データセットなど、驚くほどうまく機能することを示す。
論文 参考訳(メタデータ) (2021-06-10T17:59:13Z) - Exploiting Shared Representations for Personalized Federated Learning [54.65133770989836]
本稿では,クライアント間の共有データ表現と,クライアント毎のユニークなローカルヘッダを学習するための,新しいフェデレーション学習フレームワークとアルゴリズムを提案する。
提案アルゴリズムは, クライアント間の分散計算能力を利用して, 表現の更新毎に低次元の局所パラメータに対して, 多数の局所更新を行う。
この結果は、データ分布間の共有低次元表現を学習することを目的とした、幅広い種類の問題に対するフェデレーション学習以上の関心を持っている。
論文 参考訳(メタデータ) (2021-02-14T05:36:25Z) - Flexible deep transfer learning by separate feature embeddings and
manifold alignment [0.0]
オブジェクト認識は、業界と防衛において重要な存在である。
残念ながら、既存のラベル付きデータセットでトレーニングされたアルゴリズムは、データ分布が一致しないため、直接新しいデータに一般化しない。
本稿では,各領域の特徴抽出を個別に学習することで,この制限を克服する新しいディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-22T19:24:44Z) - DomainMix: Learning Generalizable Person Re-Identification Without Human
Annotations [89.78473564527688]
本稿では,ラベル付き合成データセットとラベル付き実世界のデータセットを用いてユニバーサルモデルをトレーニングする方法を示す。
このように、人間のアノテーションはもはや不要であり、大規模で多様な現実世界のデータセットにスケーラブルである。
実験結果から,提案手法は完全な人間のアノテーションで訓練されたアノテーションとほぼ同等であることがわかった。
論文 参考訳(メタデータ) (2020-11-24T08:15:53Z) - i-Mix: A Domain-Agnostic Strategy for Contrastive Representation
Learning [117.63815437385321]
対照的な表現学習を改善するために, 単純で効果的なドメインに依存しない正規化戦略i-Mixを提案する。
実験では、i-Mixはドメイン間の学習表現の質を一貫して改善することを示した。
論文 参考訳(メタデータ) (2020-10-17T23:32:26Z) - Towards Universal Representation Learning for Deep Face Recognition [106.21744671876704]
対象のドメイン知識を活用せずに、与えられたトレーニングデータに見つからない大きな変化に対処できる普遍的な表現学習フレームワークを提案する。
実験により,LFW や MegaFace などの一般的な顔認識データセットにおいて,本手法が最高性能を実現することを示す。
論文 参考訳(メタデータ) (2020-02-26T23:29:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。