論文の概要: BSNet: Bi-Similarity Network for Few-shot Fine-grained Image
Classification
- arxiv url: http://arxiv.org/abs/2011.14311v1
- Date: Sun, 29 Nov 2020 08:38:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-07 09:03:26.196362
- Title: BSNet: Bi-Similarity Network for Few-shot Fine-grained Image
Classification
- Title(参考訳): BSNet: きめ細かい画像分類のための二相性ネットワーク
- Authors: Xiaoxu Li, Jijie Wu, Zhuo Sun, Zhanyu Ma, Jie Cao, Jing-Hao Xue
- Abstract要約: いわゆるtextitBi-Similarity Network (textitBSNet) を提案する。
両相似モジュールは、多様な特性の2つの類似度尺度に従って特徴写像を学習する。
このようにして、モデルはより差別的で類似度に富んだ特徴を、よりきめ細かい画像の少ないショットから学習することができる。
- 参考スコア(独自算出の注目度): 35.50808687239441
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot learning for fine-grained image classification has gained recent
attention in computer vision. Among the approaches for few-shot learning, due
to the simplicity and effectiveness, metric-based methods are favorably
state-of-the-art on many tasks. Most of the metric-based methods assume a
single similarity measure and thus obtain a single feature space. However, if
samples can simultaneously be well classified via two distinct similarity
measures, the samples within a class can distribute more compactly in a smaller
feature space, producing more discriminative feature maps. Motivated by this,
we propose a so-called \textit{Bi-Similarity Network} (\textit{BSNet}) that
consists of a single embedding module and a bi-similarity module of two
similarity measures. After the support images and the query images pass through
the convolution-based embedding module, the bi-similarity module learns feature
maps according to two similarity measures of diverse characteristics. In this
way, the model is enabled to learn more discriminative and less
similarity-biased features from few shots of fine-grained images, such that the
model generalization ability can be significantly improved. Through extensive
experiments by slightly modifying established metric/similarity based networks,
we show that the proposed approach produces a substantial improvement on
several fine-grained image benchmark datasets. Codes are available at:
https://github.com/spraise/BSNet
- Abstract(参考訳): 微粒化画像分類のための画像学習はコンピュータビジョンにおいて近年注目されている。
単純さと有効性のため、最小ショット学習のアプローチの中で、メトリックベースのメソッドは多くのタスクにおいて最先端の手法である。
計量に基づく手法の多くは単一の類似度尺度を仮定し、単一の特徴空間を得る。
しかし、もしサンプルを2つの異なる類似度尺度で同時に分類できるなら、クラス内のサンプルはより小さな特徴空間でよりコンパクトに分布し、より識別的な特徴写像を生成することができる。
そこで本研究では, 単一の埋め込みモジュールと2つの類似度尺度を持つ双類似性モジュールからなるいわゆる \textit{Bi-Similarity Network} (\textit{BSNet}) を提案する。
サポート画像とクエリ画像が畳み込みベースの埋め込みモジュールを通過した後、双方向モジュールは、多様な特徴の2つの類似度尺度に従って特徴マップを学習する。
このようにして、このモデルは、微粒画像のわずかなショットからより識別的で類似度の低い特徴を学習することができ、モデル一般化能力を大幅に改善することができる。
確立されたメトリック/類似性ベースのネットワークを少し変更することで、広範囲な実験を通じて、提案手法がいくつかのきめ細かな画像ベンチマークデータセットに対して大幅に改善することを示す。
https://github.com/spraise/bsnet
関連論文リスト
- Learning Contrastive Representation for Semantic Correspondence [150.29135856909477]
セマンティックマッチングのためのマルチレベルコントラスト学習手法を提案する。
画像レベルのコントラスト学習は、畳み込み特徴が類似したオブジェクト間の対応を見出すための鍵となる要素であることを示す。
論文 参考訳(メタデータ) (2021-09-22T18:34:14Z) - Towards Interpretable Deep Metric Learning with Structural Matching [86.16700459215383]
より透過的な埋め込み学習のための深層解釈可能なメトリック学習(DIML)法を提案する。
本手法は,既製のバックボーンネットワークやメトリック学習手法に適用可能な,モデルに依存しない手法である。
我々は,CUB200-2011,Cars196,Stanford Online Productsの3つの大規模メトリクス学習ベンチマークで評価を行った。
論文 参考訳(メタデータ) (2021-08-12T17:59:09Z) - Multi-level Metric Learning for Few-shot Image Recognition [5.861206243996454]
我々は、クエリイメージが3レベルの類似度メトリクスによって同時に分類できるなら、クラス内のクエリイメージはより小さな機能空間でより強く分散することができると主張する。
そこで本研究では,画素レベルの類似性だけでなく,部分レベルの特徴の類似性や分布の類似性も考慮した,マルチレベル・メトリック・ラーニング(MML)手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T12:49:07Z) - Learning to Focus: Cascaded Feature Matching Network for Few-shot Image
Recognition [38.49419948988415]
ディープネットワークは、多数の画像でトレーニングすることで、カテゴリのオブジェクトを正確に認識することを学ぶことができる。
低ショット画像認識タスク(low-shot image recognition task)として知られるメタラーニングの課題は、1つのカテゴリの認識モデルを学ぶためにアノテーション付き画像しか利用できない場合に発生する。
この問題を解決するため,Cascaded Feature Matching Network (CFMN) と呼ばれる手法を提案する。
EmphminiImageNet と Omniglot の2つの標準データセットを用いた数ショット学習実験により,本手法の有効性が確認された。
論文 参考訳(メタデータ) (2021-01-13T11:37:28Z) - Seed the Views: Hierarchical Semantic Alignment for Contrastive
Representation Learning [116.91819311885166]
一つの画像から生成されたビューをtextbfCross-samples や Multi-level representation に拡張することで,階層的なセマンティックアライメント戦略を提案する。
提案手法はCsMlと呼ばれ,サンプル間の多層視覚表現を堅牢な方法で統合する機能を備えている。
論文 参考訳(メタデータ) (2020-12-04T17:26:24Z) - Augmented Bi-path Network for Few-shot Learning [16.353228724916505]
マルチスケールでグローバル機能とローカル機能を比較するために,Augmented Bi-path Network (ABNet)を提案する。
具体的には、各画像の局所的な特徴として、有能なパッチを抽出し、埋め込みする。その後、モデルは、より堅牢な機能を強化するために、その機能を強化することを学習する。
論文 参考訳(メタデータ) (2020-07-15T11:13:38Z) - ReMarNet: Conjoint Relation and Margin Learning for Small-Sample Image
Classification [49.87503122462432]
ReMarNet(Relation-and-Margin Learning Network)と呼ばれるニューラルネットワークを導入する。
本手法は,上記2つの分類機構の双方において優れた性能を発揮する特徴を学習するために,異なるバックボーンの2つのネットワークを組み立てる。
4つの画像データセットを用いた実験により,本手法はラベル付きサンプルの小さな集合から識別的特徴を学習するのに有効であることが示された。
論文 参考訳(メタデータ) (2020-06-27T13:50:20Z) - Learning to Compare Relation: Semantic Alignment for Few-Shot Learning [48.463122399494175]
本稿では,コンテンツアライメントに頑健な関係を比較するための新しいセマンティックアライメントモデルを提案する。
数ショットの学習データセットについて広範な実験を行う。
論文 参考訳(メタデータ) (2020-02-29T08:37:02Z) - Asymmetric Distribution Measure for Few-shot Learning [82.91276814477126]
メトリクスベースの少数ショット画像分類は、クエリ画像とサポートクラスの関係を測定することを目的としている。
本稿では,非対称分布測定(ADM)ネットワークを提案する。
5ドルの$-wayの$-shotタスクで最先端のメソッドよりも3.02%の$と1.56%の$を達成しています。
論文 参考訳(メタデータ) (2020-02-01T06:41:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。