論文の概要: Dynamic Metric Learning: Towards a Scalable Metric Space to Accommodate
Multiple Semantic Scales
- arxiv url: http://arxiv.org/abs/2103.11781v1
- Date: Mon, 22 Mar 2021 12:46:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 14:27:25.017517
- Title: Dynamic Metric Learning: Towards a Scalable Metric Space to Accommodate
Multiple Semantic Scales
- Title(参考訳): 動的メトリック学習 - 複数のセマンティックスケールを収容するスケーラブルなメトリックスペースを目指して
- Authors: Yifan Sun, Yuke Zhu, Yuhan Zhang, Pengkun Zheng, Xi Qiu, Chi Zhang,
Yichen Wei
- Abstract要約: 本稿では,実世界の計測ツールから深部視覚認識まで,新しい基本的特徴,すなわちダイナミックレンジを紹介する。
異なる視覚概念は異なる意味的スケールを持つ。
例えば、Animal' と Plants' は大きな意味尺度を持ち、Elk' はずっと小さい意味尺度である。
我々は、新しいコンピュータビジョンタスク、すなわちDynamic Metric Learningを得る。
拡張可能なメトリクス空間を学習して、複数のセマンティックスケールの視覚概念に対応することを目指している。
- 参考スコア(独自算出の注目度): 45.15623895874372
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a new fundamental characteristic, \ie, the dynamic
range, from real-world metric tools to deep visual recognition. In metrology,
the dynamic range is a basic quality of a metric tool, indicating its
flexibility to accommodate various scales. Larger dynamic range offers higher
flexibility. In visual recognition, the multiple scale problem also exist.
Different visual concepts may have different semantic scales. For example,
``Animal'' and ``Plants'' have a large semantic scale while ``Elk'' has a much
smaller one. Under a small semantic scale, two different elks may look quite
\emph{different} to each other . However, under a large semantic scale (\eg,
animals and plants), these two elks should be measured as being \emph{similar}.
%We argue that such flexibility is also important for deep metric learning,
because different visual concepts indeed correspond to different semantic
scales.
Introducing the dynamic range to deep metric learning, we get a novel
computer vision task, \ie, the Dynamic Metric Learning. It aims to learn a
scalable metric space to accommodate visual concepts across multiple semantic
scales. Based on three types of images, \emph{i.e.}, vehicle, animal and online
products, we construct three datasets for Dynamic Metric Learning. We benchmark
these datasets with popular deep metric learning methods and find Dynamic
Metric Learning to be very challenging. The major difficulty lies in a conflict
between different scales: the discriminative ability under a small scale
usually compromises the discriminative ability under a large one, and vice
versa. As a minor contribution, we propose Cross-Scale Learning (CSL) to
alleviate such conflict. We show that CSL consistently improves the baseline on
all the three datasets. The datasets and the code will be publicly available at
https://github.com/SupetZYK/DynamicMetricLearning.
- Abstract(参考訳): 本稿では,実世界の計測ツールから深部視覚認識まで,新たな基本的な特徴である,ダイナミックレンジである \ie について述べる。
気象学において、ダイナミックレンジは計量ツールの基本品質であり、様々なスケールに対応する柔軟性を示している。
ダイナミックレンジが大きくなると柔軟性が向上する。
視覚認識においては、多重スケール問題も存在する。
異なる視覚概念は、異なる意味スケールを持つ。
例えば、 ``Animal'' と ``Plants'' は大きな意味尺度を持ち、 ``Elk'' はずっと小さい意味尺度である。
小さな意味のスケールでは、2つの異なるelkは互いにかなり \emph{different} に見える。
しかし、大きな意味的尺度(例えば動物と植物)では、これらの2つのelkは \emph{ similar} と測定されるべきである。
%) 異なる視覚概念が実際に異なる意味尺度に対応していることから, 深層学習においてもこのような柔軟性が重要であると論じる。
深度メートル法学習へのダイナミックレンジの導入により,新しいコンピュータビジョンタスク \ie, Dynamic Metric Learning が実現した。
複数のセマンティックスケールにわたる視覚的概念に対応するために、スケーラブルなメトリックスペースを学ぶことを目指している。
3種類の画像に基づいて、emph{i.e。
車両、動物、オンラインの製品では、動的なメトリック学習のための3つのデータセットを構築します。
これらのデータセットを一般的な深度学習手法でベンチマークし、動的メトリック学習が非常に難しいと判断する。
小さいスケールでの判別能力は、通常、大きなスケールの下での識別能力を損なうものであり、その逆である。
軽微な貢献として,このような対立を軽減するために,クロススケールラーニング(CSL)を提案する。
CSLは3つのデータセットのベースラインを一貫して改善する。
データセットとコードはhttps://github.com/SupetZYK/DynamicMetricLearning.comで公開される。
関連論文リスト
- Scale-Equivariant Deep Learning for 3D Data [44.52688267348063]
畳み込みニューラルネットワーク(CNN)は、画像の位置に関係なく物体を認識する。
本稿では,3次元データに対するスケール・等価な畳み込みネットワーク層を提案する。
本実験は,3次元医用画像解析の尺度等式化における提案手法の有効性を実証するものである。
論文 参考訳(メタデータ) (2023-04-12T13:56:12Z) - Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-25T04:48:11Z) - Self-Supervised Representation Learning With MUlti-Segmental
Informational Coding (MUSIC) [6.693379403133435]
自己教師付き表現学習は、高次元データを意味のある埋め込み空間にマッピングする。
自己教師型表現学習のためのMUSIC(MUlti-Segmental Informational Coding)を提案する。
論文 参考訳(メタデータ) (2022-06-13T20:37:48Z) - UniVIP: A Unified Framework for Self-Supervised Visual Pre-training [50.87603616476038]
単一中心オブジェクトまたは非調和データセット上で,汎用的な視覚表現を学習するための,新しい自己教師型フレームワークを提案する。
大規模実験により、非高調波COCOで事前訓練されたUniVIPは、最先端の転送性能を実現することが示された。
また、ImageNetのような単一中心オブジェクトのデータセットを利用でき、線形探索において同じ事前学習エポックでBYOLを2.5%上回る。
論文 参考訳(メタデータ) (2022-03-14T10:04:04Z) - Adaptive Poincar\'e Point to Set Distance for Few-Shot Classification [30.84627437310717]
我々は,学習した集合に関連付けられた点と集合の間の距離を特徴付けるために,文脈対応の双曲的計量を学習する。
実験によって,このような測定値が外接点の存在下で得られることが示され,ベースラインモデルよりも明確な改善が達成される。
論文 参考訳(メタデータ) (2021-12-03T05:08:11Z) - Adaptive Hierarchical Similarity Metric Learning with Noisy Labels [138.41576366096137]
適応的階層的類似度メトリック学習法を提案する。
ノイズに敏感な2つの情報、すなわち、クラスワイドのばらつきとサンプルワイドの一貫性を考える。
提案手法は,現在の深層学習手法と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-10-29T02:12:18Z) - Towards Interpretable Deep Metric Learning with Structural Matching [86.16700459215383]
より透過的な埋め込み学習のための深層解釈可能なメトリック学習(DIML)法を提案する。
本手法は,既製のバックボーンネットワークやメトリック学習手法に適用可能な,モデルに依存しない手法である。
我々は,CUB200-2011,Cars196,Stanford Online Productsの3つの大規模メトリクス学習ベンチマークで評価を行った。
論文 参考訳(メタデータ) (2021-08-12T17:59:09Z) - Metric Learning vs Classification for Disentangled Music Representation
Learning [36.74680586571013]
本稿では,メートル法学習と分類,ゆがみの関係を包括的に解明する単一の表現学習フレームワークを提案する。
分類に基づくモデルは、訓練時間、類似性検索、自動タグ付けに一般的に有利であるのに対し、深度検定学習は三重項予測により良い性能を示す。
論文 参考訳(メタデータ) (2020-08-09T13:53:12Z) - Sharing Matters for Generalization in Deep Metric Learning [22.243744691711452]
本研究は,アノテーションやデータトレーニングを必要とせずに,クラスを分離した特徴を学習する方法を検討する。
我々のアプローチを新しいトリプルトサンプリング戦略として定式化することにより、最近のランキング損失フレームワークに容易に適用できる。
論文 参考訳(メタデータ) (2020-04-12T10:21:15Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。