論文の概要: Image Retrieval Methods in the Dissimilarity Space
- arxiv url: http://arxiv.org/abs/2412.08618v1
- Date: Wed, 11 Dec 2024 18:39:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:03:52.104036
- Title: Image Retrieval Methods in the Dissimilarity Space
- Title(参考訳): 異種空間における画像検索手法
- Authors: Madhu Kiran, Kartikey Vishnu, Rafael M. O. Cruz, Eric Granger,
- Abstract要約: 特徴相似性空間は類似性マッチングにより適していると主張する。
また、プロジェクトクエリと参照埋め込みに対する二分変換を、異種空間への単一の埋め込みに提案する。
クエリと参照埋め込みの距離を比較するのとは対照的に、単一異種空間の埋め込みを分類する利点を示す。
- 参考スコア(独自算出の注目度): 10.00342846297521
- License:
- Abstract: Image retrieval methods rely on metric learning to train backbone feature extraction models that can extract discriminant queries and reference (gallery) feature representations for similarity matching. Although state-of-the-art accuracy has improved considerably with the advent of deep learning (DL) models trained on large datasets, image retrieval remains challenging in many real-world video analytics and surveillance applications, e.g., person re-identification. Using the Euclidean space for matching limits the performance in real-world applications due to the curse of dimensionality, overfitting, and sensitivity to noisy data. We argue that the feature dissimilarity space is more suitable for similarity matching, and propose a dichotomy transformation to project query and reference embeddings into a single embedding in the dissimilarity space. We also advocate for end-to-end training of a backbone and binary classification models for pair-wise matching. As opposed to comparing the distance between queries and reference embeddings, we show the benefits of classifying the single dissimilarity space embedding (as similar or dissimilar), especially when trained end-to-end. We propose a method to train the max-margin classifier together with the backbone feature extractor by applying constraints to the L2 norm of the classifier weights along with the hinge loss. Our extensive experiments on challenging image retrieval datasets and using diverse feature extraction backbones highlight the benefits of similarity matching in the dissimilarity space. In particular, when jointly training the feature extraction backbone and regularised classifier for matching, the dissimilarity space provides a higher level of accuracy.
- Abstract(参考訳): 画像検索手法は、類似性マッチングのための識別クエリと参照(ギャレリー)特徴表現を抽出できるバックボーン特徴抽出モデルをトレーニングするためのメトリック学習に依存する。
大規模データセットで訓練されたディープラーニング(DL)モデルの出現に伴い、最先端の精度は大幅に向上したが、実際のビデオ分析や監視アプリケーション(例えば、人物の再識別など)では画像検索が困難である。
一致するためにユークリッド空間を使用すると、次元性の呪い、過度にフィットし、ノイズの多いデータに対する感度によって、現実世界のアプリケーションの性能が制限される。
特徴相似性空間は類似性マッチングにより適しており、プロジェクトクエリへの二分変換と参照埋め込みを相似性空間への単一の埋め込みに提案する。
また、ペアワイズマッチングのためのバックボーンとバイナリ分類モデルのエンドツーエンドトレーニングも提唱する。
クエリと参照埋め込みの距離を比較するのとは対照的に、特に訓練されたエンドツーエンドにおいて、単一異種空間の埋め込み(類似または異種)を分類する利点を示す。
そこで本研究では,最大マージン分類器と背骨特徴抽出器を併用して,ヒンジ損失とともに,分類器重みのL2ノルムに制約を適用することによって,最大マージン分類器を訓練する方法を提案する。
画像検索データセットの挑戦と多様な特徴抽出バックボーンの使用に関する広範な実験は、相似性空間における類似性マッチングの利点を強調した。
特に、特徴抽出バックボーンとマッチングのための正規化分類器を共同で訓練する場合、相似性空間はより高い精度を提供する。
関連論文リスト
- GSSF: Generalized Structural Sparse Function for Deep Cross-modal Metric Learning [51.677086019209554]
ペアワイド類似性学習のためのモダリティ間の強力な関係を捕捉する汎用構造スパースを提案する。
距離メートル法は、対角線とブロック対角線の2つの形式を微妙にカプセル化する。
クロスモーダルと2つの余分なユニモーダル検索タスクの実験は、その優位性と柔軟性を検証した。
論文 参考訳(メタデータ) (2024-10-20T03:45:50Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Hodge-Aware Contrastive Learning [101.56637264703058]
単純コンプレックスは、マルチウェイ依存によるデータのモデリングに有効である。
我々は、単純なデータを処理するための対照的な自己教師付き学習手法を開発した。
論文 参考訳(メタデータ) (2023-09-14T00:40:07Z) - Histopathology Image Classification using Deep Manifold Contrastive
Learning [8.590026259176806]
本稿では,特徴間の測地的距離を,病理組織学全体のスライド画像分類の類似度指標として活用する,新しいコントラスト学習の拡張を提案する。
その結果,提案手法は最先端のコサイン距離に基づくコントラスト学習法よりも優れていた。
論文 参考訳(メタデータ) (2023-06-26T07:02:07Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Deep Relational Metric Learning [84.95793654872399]
本稿では,画像クラスタリングと検索のためのディープリレーショナルメトリック学習フレームワークを提案する。
我々は、クラス間分布とクラス内分布の両方をモデル化するために、異なる側面から画像を特徴付ける特徴のアンサンブルを学ぶ。
広く使われているCUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、我々のフレームワークが既存の深層学習方法を改善し、非常に競争力のある結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-08-23T09:31:18Z) - Connecting Images through Time and Sources: Introducing Low-data,
Heterogeneous Instance Retrieval [3.6526118822907594]
バリエーションやセマンティックな内容のパネルによく反応する機能を選択するのは簡単ではないことを示す。
Alegoriaベンチマークの新しい拡張バージョンを導入し、詳細なアノテーションを使って記述子を比較します。
論文 参考訳(メタデータ) (2021-03-19T10:54:51Z) - Unsupervised segmentation via semantic-apparent feature fusion [21.75371777263847]
本研究では,意味親和性特徴融合(SAFF)に基づく教師なし前景セグメンテーション手法を提案する。
前景オブジェクトのキー領域はセマンティック機能によって正確に応答できる。
意味的特徴と明らかな特徴を融合させ、画像内適応的特徴量学習と画像間共通特徴学習のモジュールをカスケードすることにより、ベースラインをはるかに超える性能を達成する。
論文 参考訳(メタデータ) (2020-05-21T08:28:49Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。