論文の概要: Threshold-Consistent Margin Loss for Open-World Deep Metric Learning
- arxiv url: http://arxiv.org/abs/2307.04047v2
- Date: Wed, 13 Mar 2024 00:52:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 18:57:16.748613
- Title: Threshold-Consistent Margin Loss for Open-World Deep Metric Learning
- Title(参考訳): オープンワールド深層学習のための閾値一貫性のあるマージン損失
- Authors: Qin Zhang, Linghan Xu, Qingming Tang, Jun Fang, Ying Nian Wu, Joe
Tighe, Yifan Xing
- Abstract要約: 画像検索にDeep Metric Learning (DML) で使われている既存の損失は、しばしば非均一なクラス内およびクラス間表現構造に繋がる。
不整合はしばしば、商用画像検索システムを展開する際のしきい値選択過程を複雑にする。
クラス間の動作特性の分散を定量化するOPIS(Operating-Point-Inconsistency-Score)と呼ばれる,新しい分散に基づく尺度を提案する。
- 参考スコア(独自算出の注目度): 42.03620337000911
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing losses used in deep metric learning (DML) for image retrieval often
lead to highly non-uniform intra-class and inter-class representation
structures across test classes and data distributions. When combined with the
common practice of using a fixed threshold to declare a match, this gives rise
to significant performance variations in terms of false accept rate (FAR) and
false reject rate (FRR) across test classes and data distributions. We define
this issue in DML as threshold inconsistency. In real-world applications, such
inconsistency often complicates the threshold selection process when deploying
commercial image retrieval systems. To measure this inconsistency, we propose a
novel variance-based metric called Operating-Point-Inconsistency-Score (OPIS)
that quantifies the variance in the operating characteristics across classes.
Using the OPIS metric, we find that achieving high accuracy levels in a DML
model does not automatically guarantee threshold consistency. In fact, our
investigation reveals a Pareto frontier in the high-accuracy regime, where
existing methods to improve accuracy often lead to degradation in threshold
consistency. To address this trade-off, we introduce the Threshold-Consistent
Margin (TCM) loss, a simple yet effective regularization technique that
promotes uniformity in representation structures across classes by selectively
penalizing hard sample pairs. Extensive experiments demonstrate TCM's
effectiveness in enhancing threshold consistency while preserving accuracy,
simplifying the threshold selection process in practical DML settings.
- Abstract(参考訳): 画像検索にDeep Metric Learning (DML) で使われている既存の損失は、テストクラスとデータ分布をまたいだクラス内およびクラス間表現構造に非常に不均一な結果をもたらすことが多い。
一致を宣言するために固定しきい値を使用する一般的な慣行と組み合わせると、テストクラスとデータ分散の間で、偽受け入れ率(FAR)と偽拒絶率(FRR)の点で、大きなパフォーマンス変化が生じる。
DMLでこの問題をしきい値の不整合と定義する。
実世界のアプリケーションでは、このような矛盾は商用画像検索システムを展開する際のしきい値選択過程を複雑にすることが多い。
この不整合を測定するために,クラス間の動作特性の分散を定量化するOPIS(Operating-Point-Inconsistency-Score)と呼ばれる,新しい分散に基づく尺度を提案する。
OPIS測定値を用いて、DMLモデルにおいて高い精度のレベルを達成することは、自動的にしきい値の一貫性を保証しない。
実際、我々の調査は、精度を向上させる既存の方法がしきい値の一貫性の低下につながるような、高精度な体制におけるParetoフロンティアを明らかにしている。
このトレードオフに対処するために,厳密なサンプルペアを選択的にペナルタイズすることにより,クラス間の表現構造の均一性を促進する,単純かつ効果的な正規化手法であるThreshold-Consistent Margin(TCM)損失を導入する。
大規模な実験では、精度を維持しながらしきい値の一貫性を向上し、実用的なDML設定におけるしきい値の選択プロセスを簡素化するTCMの有効性を示す。
関連論文リスト
- Towards Robust and Interpretable EMG-based Hand Gesture Recognition using Deep Metric Meta Learning [37.21211404608413]
本稿では,意味的かつ解釈可能な表現の作成を監督するために,EMG PRにおける深層メートル法メタラーニングへのシフトを提案する。
我々は、不正確な決定をよりよく拒否する頑健なクラス近接性に基づく信頼度推定器を導出する。
論文 参考訳(メタデータ) (2024-04-17T23:37:50Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Continual-MAE: Adaptive Distribution Masked Autoencoders for Continual Test-Time Adaptation [49.827306773992376]
連続的テスト時間適応(CTTA)は、ソース事前学習モデルから目標分布の連続的な変化に移行するために提案される。
提案手法は,CTTAタスクの分類とセグメンテーションの両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T15:34:52Z) - ProcSim: Proxy-based Confidence for Robust Similarity Learning [0.6963971634605796]
一般的なベンチマークデータセットには多くの間違ったラベルが含まれており、DMLメソッドはそれらに影響を受けやすいことを示す。
現実的なノイズの効果を研究するために、データセット内のクラスのオントロジーを作成し、それを意味論的に一貫性のあるラベル付けミスをシミュレートする。
頑健なDMLモデルをトレーニングするために,クラス代表に対して正規化距離を用いて各サンプルに信頼スコアを割り当てるフレームワークであるProcSimを提案する。
論文 参考訳(メタデータ) (2023-11-01T17:17:14Z) - Learning Prompt-Enhanced Context Features for Weakly-Supervised Video
Anomaly Detection [37.99031842449251]
弱い監督下での映像異常検出は重大な課題を呈する。
本稿では,効率的なコンテキストモデリングとセマンティック識別性の向上に焦点をあてた,弱教師付き異常検出フレームワークを提案する。
提案手法は,特定の異常なサブクラスの検出精度を大幅に向上させ,その実用的価値と有効性を裏付けるものである。
論文 参考訳(メタデータ) (2023-06-26T06:45:16Z) - An Adaptive Plug-and-Play Network for Few-Shot Learning [12.023266104119289]
少数のサンプルから学んだ後、新しいサンプルを分類するモデルが必要である。
ディープネットワークと複雑なメトリクスはオーバーフィッティングを引き起こす傾向があり、パフォーマンスをさらに改善することは困難である。
プラグアンドプレイ型モデル適応型リサイザ (MAR) とアダプティブ類似度測定器 (ASM) をその他の損失なく提案する。
論文 参考訳(メタデータ) (2023-02-18T13:25:04Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Adaptive neighborhood Metric learning [184.95321334661898]
適応的近傍距離距離学習(ANML)という新しい距離距離距離距離距離距離学習アルゴリズムを提案する。
ANMLは線形埋め込みと深層埋め込みの両方を学ぶのに使うことができる。
本手法で提案するemphlog-exp平均関数は,深層学習手法をレビューするための新たな視点を与える。
論文 参考訳(メタデータ) (2022-01-20T17:26:37Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。