論文の概要: Hierarchical Representation based Query-Specific Prototypical Network
for Few-Shot Image Classification
- arxiv url: http://arxiv.org/abs/2103.11384v1
- Date: Sun, 21 Mar 2021 12:50:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-25 06:23:42.332890
- Title: Hierarchical Representation based Query-Specific Prototypical Network
for Few-Shot Image Classification
- Title(参考訳): 階層表現型クエリ固有プロトタイプネットワークによる少数ショット画像分類
- Authors: Yaohui Li and Huaxiong Li and Haoxing Chen and Chunlin Chen
- Abstract要約: 少数の画像分類は、少数のラベル付きトレーニングデータで見えないカテゴリを認識することを目的としています。
最近のメトリックベースのフレームワークは、固定されたプロトタイプ(例えば、サポートカテゴリの平均)でサポートクラスを表現し、クエリインスタンスとサポートプロトタイプの類似性に応じて分類する傾向にある。
本稿では,クエリサンプル毎に領域レベルのプロトタイプを生成することで,制約に対処するための階層表現型クエリ固有プロトタイプネットワーク(qpn)を提案する。
- 参考スコア(独自算出の注目度): 5.861206243996454
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot image classification aims at recognizing unseen categories with a
small number of labeled training data. Recent metric-based frameworks tend to
represent a support class by a fixed prototype (e.g., the mean of the support
category) and make classification according to the similarities between query
instances and support prototypes. However, discriminative dominant regions may
locate uncertain areas of images and have various scales, which leads to the
misaligned metric. Besides, a fixed prototype for one support category cannot
fit for all query instances to accurately reflect their distances with this
category, which lowers the efficiency of metric. Therefore, query-specific
dominant regions in support samples should be extracted for a high-quality
metric. To address these problems, we propose a Hierarchical Representation
based Query-Specific Prototypical Network (QPN) to tackle the limitations by
generating a region-level prototype for each query sample, which achieves both
positional and dimensional semantic alignment simultaneously. Extensive
experiments conducted on five benchmark datasets (including three fine-grained
datasets) show that our proposed method outperforms the current
state-of-the-art methods.
- Abstract(参考訳): 少数ショット画像分類は、少数のラベル付きトレーニングデータで、目に見えないカテゴリを認識することを目的としている。
最近のメトリックベースのフレームワークは、固定されたプロトタイプ(例えば、サポートカテゴリの平均)でサポートクラスを表現し、クエリインスタンスとサポートプロトタイプの類似性に応じて分類する傾向にある。
しかし、差別的な支配地域は画像の不確かさのある領域を見つけ出し、様々なスケールを持つ可能性がある。
さらに、1つのサポートカテゴリの固定されたプロトタイプは、すべてのクエリインスタンスに適合せず、このカテゴリとの距離を正確に反映できないため、メトリックの効率が低下する。
したがって, 高品質な指標として, サポートサンプル中のクエリ固有支配領域を抽出する必要がある。
これらの問題に対処するために,各クエリの領域レベルのプロトタイプを生成し,位置的および次元的セマンティックアライメントを同時に実現する階層的表現に基づくクエリ特化プロトタイプネットワーク(QPN)を提案する。
5つのベンチマークデータセット(3つのきめ細かいデータセットを含む)で実施された大規模な実験により、提案手法が現在の最先端手法よりも優れていることが示された。
関連論文リスト
- Few-Shot Multi-Label Aspect Category Detection Utilizing Prototypical
Network with Sentence-Level Weighting and Label Augmentation [3.140750628178514]
マルチラベルアスペクトカテゴリ検出は、与えられた文で発生する複数のアスペクトカテゴリを検出することを目的としている。
本稿では,各サポートセットインスタンスに対して,単語レベルでのノイズを軽減するために,拡張ラベル情報とともに,サポートセットの注意を喚起する。
文単位の注意機構を用いて,各インスタンスに異なる重みを与えることで,平均化によるプロトタイプの計算を行う。
論文 参考訳(メタデータ) (2023-09-27T11:44:04Z) - Adaptive Parametric Prototype Learning for Cross-Domain Few-Shot
Classification [23.82751179819225]
本稿では,メタラーニング・コンベンションの下で新しい適応パラメトリックプロトタイプ学習法(APPL)を開発した。
APPLは多くの最先端のクロスドメイン・ショット・ラーニング手法よりも優れた性能が得られる。
論文 参考訳(メタデータ) (2023-09-04T03:58:50Z) - Not All Instances Contribute Equally: Instance-adaptive Class
Representation Learning for Few-Shot Visual Recognition [94.04041301504567]
少数ショットの視覚認識は、いくつかのラベル付きインスタンスから新しい視覚概念を認識することを指す。
本稿では,数ショットの視覚認識を実現するために,インスタンス適応型クラス表現学習ネットワーク(ICRL-Net)と呼ばれる新しいメトリックベースのメタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-07T10:00:18Z) - Multi-Label Few-Shot Learning for Aspect Category Detection [23.92900196246631]
感情分析におけるアスペクトカテゴリー検出(ACD)は、文中のアスペクトカテゴリを特定することを目的としている。
既存の数発の学習アプローチは、主にシングルラベルの予測に焦点を当てている。
本稿では,プロトタイプネットワークに基づく複数ラベルの複数ショット学習手法を提案する。
論文 参考訳(メタデータ) (2021-05-29T01:56:11Z) - Prototypical Region Proposal Networks for Few-Shot Localization and
Classification [1.5100087942838936]
分割と分類をエンドツーエンドの分類モデルであるPRoPnetに統一するフレームワークを開発する。
本手法は,複数のオブジェクトクラスを含む自然シーンを用いた画像データセットの精度向上を実証した。
論文 参考訳(メタデータ) (2021-04-08T04:03:30Z) - I^3Net: Implicit Instance-Invariant Network for Adapting One-Stage
Object Detectors [64.93963042395976]
暗黙のInstance-Invariant Network(I3Net)は、ワンステージ検出器の適応に適しています。
i3netは、異なる層における深い特徴の自然な特徴を利用してインスタンス不変な特徴を暗黙的に学習する。
実験によると、I3Netはベンチマークデータセットの最先端のパフォーマンスを上回っている。
論文 参考訳(メタデータ) (2021-03-25T11:14:36Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - A Universal Representation Transformer Layer for Few-Shot Image
Classification [43.31379752656756]
少ないショット分類は、少数のサンプルで示される場合、目に見えないクラスを認識することを目的としている。
本稿では,多様なデータソースから未確認のクラスやサンプルを抽出するマルチドメイン・少数ショット画像分類の問題点について考察する。
そこで本研究では,メタ学習者がユニバーサルな特徴を活用できるユニバーサル表現変換器層を提案する。
論文 参考訳(メタデータ) (2020-06-21T03:08:00Z) - Cross-domain Detection via Graph-induced Prototype Alignment [114.8952035552862]
カテゴリレベルのドメインアライメントを求めるグラフ誘発プロトタイプアライメント(GPA)フレームワークを提案する。
さらに,クラス不均衡がドメイン適応に与える影響を軽減するために,クラス重み付きコントラスト損失を設計する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-03-28T17:46:55Z) - Selecting Relevant Features from a Multi-domain Representation for
Few-shot Classification [91.67977602992657]
本稿では,従来の特徴適応手法よりもシンプルかつ効果的である特徴選択に基づく新しい戦略を提案する。
このような特徴の上に構築された単純な非パラメトリック分類器は高い精度を示し、訓練中に見たことのない領域に一般化する。
論文 参考訳(メタデータ) (2020-03-20T15:44:17Z) - Cross-Domain Few-Shot Classification via Learned Feature-Wise
Transformation [109.89213619785676]
各クラスにラベル付き画像がほとんどない新しいカテゴリを識別することを目的としている。
既存のメトリックベースの数ショット分類アルゴリズムは、クエリ画像の特徴埋め込みとラベル付き画像の特徴埋め込みを比較して、カテゴリを予測する。
有望な性能が証明されているが、これらの手法は目に見えない領域に一般化できないことが多い。
論文 参考訳(メタデータ) (2020-01-23T18:55:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。