論文の概要: Task-Oriented Channel Attention for Fine-Grained Few-Shot Classification
- arxiv url: http://arxiv.org/abs/2308.00093v1
- Date: Fri, 28 Jul 2023 08:40:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 16:30:10.889233
- Title: Task-Oriented Channel Attention for Fine-Grained Few-Shot Classification
- Title(参考訳): 細粒度マイズショット分類のためのタスク指向チャネル注意
- Authors: SuBeen Lee, WonJun Moon, Hyun Seok Seong, and Jae-Pil Heo
- Abstract要約: Task Discrepancy Maximization (TDM) はタスク指向のチャネルアテンション手法であり、微粒な小ショット分類に適したものである。
QAMはクエリのオブジェクト関連チャネルにより高い重みを割り当てている。
これらのサブモジュールに基づいて、TDMは、クラス識別の詳細を符号化し、クエリが保持するチャネルに焦点を当て、タスク適応機能を生成する。
- 参考スコア(独自算出の注目度): 5.4352987210173955
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The difficulty of the fine-grained image classification mainly comes from a
shared overall appearance across classes. Thus, recognizing discriminative
details, such as eyes and beaks for birds, is a key in the task. However, this
is particularly challenging when training data is limited. To address this, we
propose Task Discrepancy Maximization (TDM), a task-oriented channel attention
method tailored for fine-grained few-shot classification with two novel modules
Support Attention Module (SAM) and Query Attention Module (QAM). SAM highlights
channels encoding class-wise discriminative features, while QAM assigns higher
weights to object-relevant channels of the query. Based on these submodules,
TDM produces task-adaptive features by focusing on channels encoding
class-discriminative details and possessed by the query at the same time, for
accurate class-sensitive similarity measure between support and query
instances. While TDM influences high-level feature maps by task-adaptive
calibration of channel-wise importance, we further introduce Instance Attention
Module (IAM) operating in intermediate layers of feature extractors to
instance-wisely highlight object-relevant channels, by extending QAM. The
merits of TDM and IAM and their complementary benefits are experimentally
validated in fine-grained few-shot classification tasks. Moreover, IAM is also
shown to be effective in coarse-grained and cross-domain few-shot
classifications.
- Abstract(参考訳): きめ細かい画像分類の難しさは、主にクラス間で共有された全体的な外観から生じる。
したがって、鳥の目やくちばしなどの識別的詳細を認識することが重要な課題である。
しかし、トレーニングデータに制限がある場合、これは特に難しい。
そこで本研究では,2つの新規モジュールによるタスク対応型チャネルアテンションモジュール (sam) とクエリアテンションモジュール (qam) を用いたタスク指向チャネルアテンション手法であるtask discrepancy maximization (tdm)を提案する。
sam氏はクラス毎の判別機能をエンコードするチャネルを強調し、qamはクエリのオブジェクト関連チャネルに重みを割り当てる。
これらのサブモジュールに基づいて、TDMは、サポートとクエリインスタンス間の正確なクラス依存の類似度測定のために、クラス識別の詳細を符号化し、クエリによって同時に保持されるチャネルに焦点を当て、タスク適応機能を生成する。
TDMはタスク適応型チャネルワイドのキャリブレーションによる高レベルの特徴マップに影響を与えるが、QAMを拡張してオブジェクト関連チャネルを例に強調するために、特徴抽出器の中間層で動作するインスタンス注意モジュール(IAM)をさらに導入する。
TDMとIAMの利点とそれらの相補的な利点は、きめ細かい分類タスクにおいて実験的に検証される。
さらに、IAMは、粗粒度およびクロスドメインのショット分類にも有効であることが示されている。
関連論文リスト
- Multiple Instance Verification [11.027466339522777]
本稿では,注目に基づく複数インスタンス学習手法と標準検証手法の素直な適応が,この設定には適さないことを示す。
CAPフレームワークでは、ターゲットバッグ内の非常に類似したインスタンスを区別する問題に対処する2つの新しい注意機能を提案する。
論文 参考訳(メタデータ) (2024-07-09T04:51:22Z) - Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - Enhancing Few-shot CLIP with Semantic-Aware Fine-Tuning [61.902254546858465]
Contrastive Language-Image Pre-Trainingに基づく手法は、数発の適応タスクで有望な性能を示した。
本稿では,タスク固有のセマンティクスに焦点を合わせるために,トレーニングプロセス中にアテンションプーリング層のパラメータを微調整することを提案する。
論文 参考訳(メタデータ) (2023-11-08T05:18:57Z) - Task Discrepancy Maximization for Fine-grained Few-Shot Classification [6.0158981171030685]
Task Discrepancy Maximization (TDM) は、微粒な小ショット分類のための単純なモジュールである。
本研究の目的は,クラス固有の情報を表現したチャネルを強調表示することで,クラス単位の識別領域をローカライズすることである。
論文 参考訳(メタデータ) (2022-07-04T12:54:58Z) - Continual Object Detection via Prototypical Task Correlation Guided
Gating Mechanism [120.1998866178014]
pRotOtypeal taSk corrElaTion guided gaTingAnism (ROSETTA)による連続物体検出のためのフレキシブルなフレームワークを提案する。
具体的には、統一されたフレームワークはすべてのタスクで共有され、タスク対応ゲートは特定のタスクのサブモデルを自動的に選択するために導入されます。
COCO-VOC、KITTI-Kitchen、VOCのクラスインクリメンタル検出、および4つのタスクの逐次学習の実験により、ROSETTAが最先端のパフォーマンスを得ることが示された。
論文 参考訳(メタデータ) (2022-05-06T07:31:28Z) - Activation Modulation and Recalibration Scheme for Weakly Supervised
Semantic Segmentation [24.08326440298189]
弱教師付きセマンティックセグメンテーションのための新しいアクティベーション変調と再校正手法を提案する。
PASCAL VOC 2012データセット上で,AMRが新たな最先端パフォーマンスを確立することを示す。
また,本手法はプラグアンドプレイであり,他の手法と組み合わせて性能向上を図ることが可能であることを実験により明らかにした。
論文 参考訳(メタデータ) (2021-12-16T16:26:14Z) - Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised
Semantic Segmentation [88.49669148290306]
そこで我々はAuxSegNetと呼ばれる弱教師付きマルチタスク・フレームワークを提案し,サリエンシ検出とマルチラベル画像分類を補助タスクとして活用する。
同様の構造的セマンティクスに着想を得て,サリエンシとセグメンテーションの表現から,クロスタスクなグローバル画素レベルの親和性マップを学習することを提案する。
学習されたクロスタスク親和性は、両方のタスクに対して改善された擬似ラベルを提供するために、唾液度予測を洗練し、CAMマップを伝播するために使用することができる。
論文 参考訳(メタデータ) (2021-07-25T11:39:58Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - Channel DropBlock: An Improved Regularization Method for Fine-Grained
Visual Classification [58.07257910065007]
既存のアプローチは主に、識別的部分を見つけるための注意機構や、高度にパラメータ化された特徴を弱教師付きで抽出する特徴符号化アプローチを導入することでこの問題に対処している。
本研究では,CDB(Channel DropBlock)と呼ばれる軽量で効果的な正規化手法を提案する。
論文 参考訳(メタデータ) (2021-06-07T09:03:02Z) - Fine-Grained Visual Classification via Simultaneously Learning of
Multi-regional Multi-grained Features [15.71408474557042]
きめ細かい視覚分類は、同じメタクラスに属するサブクラスを認識する難しいタスクである。
本稿では,マルチリージョンのマルチグラニュアルな特徴をマイニングすることが,この課題の鍵となることを論じる。
4つの画像分類データセットを用いた実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2021-01-31T03:46:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。