論文の概要: Weakly-supervised Object Localization for Few-shot Learning and
Fine-grained Few-shot Learning
- arxiv url: http://arxiv.org/abs/2003.00874v3
- Date: Sat, 12 Dec 2020 02:50:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 04:05:01.391349
- Title: Weakly-supervised Object Localization for Few-shot Learning and
Fine-grained Few-shot Learning
- Title(参考訳): ファウショット学習とファウショット学習のための弱教師付き物体位置決め
- Authors: Xiaojian He, Jinfu Lin, Junming Shen
- Abstract要約: 少数のサンプルから新しい視覚カテゴリーを学習することを目的としている。
本稿では,自己認識型補完モジュール(SACモジュール)を提案する。
また,数発の分類のために,識別的深層記述子を選択するためのアクティブマスクも生成する。
- 参考スコア(独自算出の注目度): 0.5156484100374058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot learning (FSL) aims to learn novel visual categories from very few
samples, which is a challenging problem in real-world applications. Many
methods of few-shot classification work well on general images to learn global
representation. However, they can not deal with fine-grained categories well at
the same time due to a lack of subtle and local information. We argue that
localization is an efficient approach because it directly provides the
discriminative regions, which is critical for both general classification and
fine-grained classification in a low data regime. In this paper, we propose a
Self-Attention Based Complementary Module (SAC Module) to fulfill the
weakly-supervised object localization, and more importantly produce the
activated masks for selecting discriminative deep descriptors for few-shot
classification. Based on each selected deep descriptor, Semantic Alignment
Module (SAM) calculates the semantic alignment distance between the query and
support images to boost classification performance. Extensive experiments show
our method outperforms the state-of-the-art methods on benchmark datasets under
various settings, especially on the fine-grained few-shot tasks. Besides, our
method achieves superior performance over previous methods when training the
model on miniImageNet and evaluating it on the different datasets,
demonstrating its superior generalization capacity. Extra visualization shows
the proposed method can localize the key objects more interval.
- Abstract(参考訳): FSL(Few-shot Learning)は、ごく少数のサンプルから新しい視覚カテゴリーを学習することを目的としている。
少数ショット分類の多くの方法は、全体表現を学ぶために一般的な画像でうまく機能する。
しかし、微妙で局所的な情報がないため、細かなカテゴリを同時に扱うことはできない。
ローカライゼーションは、一般的な分類と低データ体制におけるきめ細かい分類の両方に欠かせない識別領域を直接提供するため、効率的なアプローチであると主張する。
本稿では,弱教師付き物体定位を実現するために,自己アテンションに基づく補完モジュール(sacモジュール)を提案する。
選択したディープディスクリプタに基づいて、セマンティックアライメントモジュール(SAM)はクエリとサポートイメージ間のセマンティックアライメント距離を計算し、分類性能を向上する。
大規模な実験により,提案手法は様々な条件下でのベンチマークデータセット,特にきめ細かいショットタスクにおいて,最先端の手法よりも優れていた。
さらに,miniimagenet上でモデルをトレーニングし,異なるデータセットで評価した場合,従来の手法よりも優れた性能を達成し,その優れた一般化能力を示す。
余分な可視化は、提案手法が鍵オブジェクトをもっと間隔でローカライズできることを示している。
関連論文リスト
- Learning to Adapt Category Consistent Meta-Feature of CLIP for Few-Shot Classification [1.6385815610837167]
最近のCLIPに基づく手法では、画像分類タスクにおいてゼロショットと少数ショットのパフォーマンスが期待できる。
LRと高レベルセマンティック表現の相補的な長所を組み合わせたメタ機能適応法(MF-Adapter)を提案する。
提案手法は,最先端のCLIP下流数ショット分類法よりも優れており,難易度の高い視覚的分類課題に対して高い性能を示す。
論文 参考訳(メタデータ) (2024-07-08T06:18:04Z) - Disambiguation of One-Shot Visual Classification Tasks: A Simplex-Based
Approach [8.436437583394998]
本稿では,複数の物体の存在を検出するための戦略を提案する。
この戦略は、高次元空間における単純体の角を識別することに基づいている。
提案手法は,極端設定における精度をわずかながら統計的に向上させる能力を示す。
論文 参考訳(メタデータ) (2023-01-16T11:37:05Z) - A Task-aware Dual Similarity Network for Fine-grained Few-shot Learning [19.90385022248391]
TDSNet(Task-aware Dual similarity Network)は,グローバルな不変機能と識別的局所的詳細を探索する手法である。
TDSNetは、他の最先端アルゴリズムと比較することで、競争性能を達成する。
論文 参考訳(メタデータ) (2022-10-22T04:24:55Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - Revisiting Deep Local Descriptor for Improved Few-Shot Classification [56.74552164206737]
textbfDense textbfClassification と textbfAttentive textbfPooling を利用して埋め込みの質を向上させる方法を示す。
広範に使われているグローバル平均プール (GAP) の代わりに, 注意深いプールを施し, 特徴マップをプールすることを提案する。
論文 参考訳(メタデータ) (2021-03-30T00:48:28Z) - Multi-scale Adaptive Task Attention Network for Few-Shot Learning [5.861206243996454]
少数ショット学習の目標は、ラベル付きサンプルの少ない未確認カテゴリを分類することである。
本稿では,マルチスケール適応タスク注意ネットワーク(MATANet)を提案する。
論文 参考訳(メタデータ) (2020-11-30T00:36:01Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Few-shot Classification via Adaptive Attention [93.06105498633492]
ごく少数の参照サンプルに基づいて,クエリサンプル表現を最適化し,高速に適応する新しい数ショット学習手法を提案する。
実験で実証したように,提案モデルでは,様々なベンチマーク数ショット分類と微粒化認識データセットを用いて,最先端の分類結果を達成している。
論文 参考訳(メタデータ) (2020-08-06T05:52:59Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。