論文の概要: Tree Structure-Aware Few-Shot Image Classification via Hierarchical
Aggregation
- arxiv url: http://arxiv.org/abs/2207.06989v1
- Date: Thu, 14 Jul 2022 15:17:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-15 14:16:30.081443
- Title: Tree Structure-Aware Few-Shot Image Classification via Hierarchical
Aggregation
- Title(参考訳): 階層的アグリゲーションによる木構造を考慮した少数ショット画像分類
- Authors: Min Zhang and Siteng Huang and Wenbin Li and Donglin Wang
- Abstract要約: 我々は、プレテキストタスクを通して、数ショットの画像分類のための追加の特徴表現を学習する方法に焦点をあてる。
この追加の知識は、数発の学習のパフォーマンスをさらに向上させることができる。
本稿では,FSLとプレテキストタスクの関係を学習する階層木構造認識(HTS)手法を提案する。
- 参考スコア(独自算出の注目度): 27.868736254566397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we mainly focus on the problem of how to learn additional
feature representations for few-shot image classification through pretext tasks
(e.g., rotation or color permutation and so on). This additional knowledge
generated by pretext tasks can further improve the performance of few-shot
learning (FSL) as it differs from human-annotated supervision (i.e., class
labels of FSL tasks). To solve this problem, we present a plug-in Hierarchical
Tree Structure-aware (HTS) method, which not only learns the relationship of
FSL and pretext tasks, but more importantly, can adaptively select and
aggregate feature representations generated by pretext tasks to maximize the
performance of FSL tasks. A hierarchical tree constructing component and a
gated selection aggregating component is introduced to construct the tree
structure and find richer transferable knowledge that can rapidly adapt to
novel classes with a few labeled images. Extensive experiments show that our
HTS can significantly enhance multiple few-shot methods to achieve new
state-of-the-art performance on four benchmark datasets. The code is available
at: https://github.com/remiMZ/HTS-ECCV22.
- Abstract(参考訳): 本稿では,プレテキストタスク(例えば,回転や色順変化など)を通じて,少数ショット画像分類のための付加的な特徴表現を学習する方法の問題に焦点をあてる。
プレテキストタスクによって生成されたこの追加知識は、人間のアノテーションによる監督(例えば、FSLタスクのクラスラベル)と異なるため、少数ショット学習(FSL)の性能をさらに向上させることができる。
この問題を解決するために,FSLタスクとプレテキストタスクの関係を学習するだけでなく,プリテキストタスクによって生成された特徴表現を適応的に選択し,FSLタスクの性能を最大化できるプラグイン階層木構造認識(HTS)手法を提案する。
階層木構築コンポーネントとゲート選択集約コンポーネントを導入し、木構造を構築し、ラベル付き画像がいくつかある新しいクラスに迅速に適応できるよりリッチな伝達可能な知識を求める。
広範な実験により、我々のhtsは4つのベンチマークデータセットで新たな最先端性能を達成するために、複数の数ショットメソッドを著しく強化できることが示されました。
コードはhttps://github.com/remimz/hts-eccv22。
関連論文リスト
- HGCLIP: Exploring Vision-Language Models with Graph Representations for Hierarchical Understanding [18.95003393925676]
異なる階層レベルでカテゴリを分類する場合、従来のユニモーダルアプローチは主にイメージ機能に焦点を当て、複雑なシナリオにおける制限を明らかにする。
ビジョンランゲージモデル(VLM)とクラス階層を統合する最近の研究は、将来性を示しているが、階層関係を完全に活用するには至っていない。
本稿では,CLIPとグラフ表現学習による階層型クラス構造のより深い活用を効果的に組み合わせた新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-23T15:42:42Z) - Many or Few Samples? Comparing Transfer, Contrastive and Meta-Learning
in Encrypted Traffic Classification [68.19713459228369]
我々は、トランスファーラーニング、メタラーニング、コントラストラーニングを、参照機械学習(ML)ツリーベースおよびモノリシックDLモデルと比較する。
i) 大規模なデータセットを用いて,より一般的な表現を得られること,(ii) コントラスト学習が最良の手法であることを示している。
MLツリーベースでは大きなタスクは処理できないが、学習した表現を再利用することで、小さなタスクにも適合するが、DLメソッドはツリーベースモデルのパフォーマンスにも到達している。
論文 参考訳(メタデータ) (2023-05-21T11:20:49Z) - Deep Hierarchical Semantic Segmentation [76.40565872257709]
階層的セマンティックセマンティックセグメンテーション(HSS)は、クラス階層の観点で視覚的観察を構造化、ピクセル単位で記述することを目的としている。
HSSNは、HSSを画素単位のマルチラベル分類タスクとしてキャストし、現在のセグメンテーションモデルに最小限のアーキテクチャ変更をもたらすだけである。
階層構造によって引き起こされるマージンの制約により、HSSNはピクセル埋め込み空間を再評価し、よく構造化されたピクセル表現を生成する。
論文 参考訳(メタデータ) (2022-03-27T15:47:44Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Attribute Propagation Network for Graph Zero-shot Learning [57.68486382473194]
属性伝達ネットワーク (APNet) を導入し, 1) クラス毎に属性ベクトルを生成するグラフ伝搬モデルと, 2) パラメータ化隣人 (NN) 分類器から構成する。
APNetは、2つのゼロショット学習設定と5つのベンチマークデータセットによる実験で、魅力的なパフォーマンスまたは新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-09-24T16:53:40Z) - HOSE-Net: Higher Order Structure Embedded Network for Scene Graph
Generation [20.148175528691905]
本稿では,関係の局所的および大域的構造情報を出力空間に組み込むための新しい構造認識型組込み分類器(SEC)モジュールを提案する。
また,高次構造情報を導入して部分空間の数を減らし,階層的セマンティックアグリゲーション(HSA)モジュールを提案する。
提案したHOSE-Netは、Visual GenomeとVRDの2つの人気のあるベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-08-12T07:58:13Z) - Group Based Deep Shared Feature Learning for Fine-grained Image
Classification [31.84610555517329]
共有された特徴を明示的にモデル化し、その効果を除去し、拡張された分類結果を得るための新しいディープネットワークアーキテクチャを提案する。
我々はこのフレームワークをグループベースのDeep Shared Feature Learning (GSFL)と呼び、学習したネットワークをGSFL-Netと呼ぶ。
特殊オートエンコーダの重要な利点は、多用途であり、最先端のきめ細かい特徴抽出モデルと組み合わせて、それらと一緒にトレーニングすることで、パフォーマンスを直接改善できる点である。
論文 参考訳(メタデータ) (2020-04-04T00:01:11Z) - Adversarial Continual Learning [99.56738010842301]
本稿では,タスク不変およびタスク特化機能に対する不整合表現を学習するハイブリッド連続学習フレームワークを提案する。
本モデルでは,タスク固有のスキルの忘れを防止するためにアーキテクチャの成長と,共有スキルを維持するための経験的リプレイアプローチを組み合わせる。
論文 参考訳(メタデータ) (2020-03-21T02:08:17Z) - TAFSSL: Task-Adaptive Feature Sub-Space Learning for few-shot
classification [50.358839666165764]
本稿では,タスク適応機能サブスペース学習(TAFSSL)により,Few-Shot Learningシナリオの性能を大幅に向上させることができることを示す。
具体的には、挑戦的な miniImageNet と tieredImageNet ベンチマークにおいて、TAFSSL はトランスダクティブおよび半教師付き FSL 設定の両方で現在の状態を改善することができることを示しています。
論文 参考訳(メタデータ) (2020-03-14T16:59:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。