論文の概要: Task Discrepancy Maximization for Fine-grained Few-Shot Classification
- arxiv url: http://arxiv.org/abs/2207.01376v1
- Date: Mon, 4 Jul 2022 12:54:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 22:28:36.941073
- Title: Task Discrepancy Maximization for Fine-grained Few-Shot Classification
- Title(参考訳): 細粒度マイズショット分類のためのタスク不一致最大化
- Authors: SuBeen Lee, WonJun Moon, Jae-Pil Heo
- Abstract要約: Task Discrepancy Maximization (TDM) は、微粒な小ショット分類のための単純なモジュールである。
本研究の目的は,クラス固有の情報を表現したチャネルを強調表示することで,クラス単位の識別領域をローカライズすることである。
- 参考スコア(独自算出の注目度): 6.0158981171030685
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recognizing discriminative details such as eyes and beaks is important for
distinguishing fine-grained classes since they have similar overall
appearances. In this regard, we introduce Task Discrepancy Maximization (TDM),
a simple module for fine-grained few-shot classification. Our objective is to
localize the class-wise discriminative regions by highlighting channels
encoding distinct information of the class. Specifically, TDM learns
task-specific channel weights based on two novel components: Support Attention
Module (SAM) and Query Attention Module (QAM). SAM produces a support weight to
represent channel-wise discriminative power for each class. Still, since the
SAM is basically only based on the labeled support sets, it can be vulnerable
to bias toward such support set. Therefore, we propose QAM which complements
SAM by yielding a query weight that grants more weight to object-relevant
channels for a given query image. By combining these two weights, a class-wise
task-specific channel weight is defined. The weights are then applied to
produce task-adaptive feature maps more focusing on the discriminative details.
Our experiments validate the effectiveness of TDM and its complementary
benefits with prior methods in fine-grained few-shot classification.
- Abstract(参考訳): 目やくちばしなどの識別的詳細を認識することは、全体的な外観が似ているため、きめ細かいクラスを区別する上で重要である。
本稿では,細粒度小ショット分類のための簡易モジュールであるtdm(task discrepancy maximization)を提案する。
本研究の目的は,クラス別情報を符号化するチャネルを強調することにより,クラス別判別領域のローカライズを行うことである。
具体的には、TDMは2つの新しいコンポーネント、SAM(Support Attention Module)とQAM(Query Attention Module)に基づいてタスク固有のチャネルウェイトを学習する。
SAMは、各クラスに対するチャネルワイドの識別力を表すサポートウェイトを生成する。
しかし、samは基本的にラベル付きサポートセットのみに基づいているため、このようなサポートセットに対するバイアスに弱い可能性がある。
そこで本研究では,クエリの重み付けによってSAMを補完するQAMを提案する。
これら2つの重みを組み合わせることで、クラスワイズタスク固有のチャネル重みが定義される。
重み付けはタスク適応機能マップの作成に応用され、より識別的詳細に焦点をあてる。
本実験は,tdmの有効性と,それ以前の手法による補足的な効果を検証する。
関連論文リスト
- Alleviating Class Imbalance in Semi-supervised Multi-organ Segmentation via Balanced Subclass Regularization [3.5622306331369993]
マルチオーガニックセグメンテーション(MoS)のための2相半教師付きネットワーク(BSR-Net)について述べる。
フェーズIでは、バランスの取れたクラスタリングに基づいて、クラスバランスの取れたサブクラス生成戦略を導入する。
The Phase II, we design a assistant subclass segmentation task in the multi-task framework of the main MoS task。
SCSタスクは、バランスの取れたサブクラス正規化をメインのMoSタスクに寄与し、バイアスのない知識をMoSネットワークに転送する。
論文 参考訳(メタデータ) (2024-08-26T07:02:17Z) - AlignSAM: Aligning Segment Anything Model to Open Context via Reinforcement Learning [61.666973416903005]
Segment Anything Model (SAM)は、オープンワールドシナリオにおいて、プロンプトのガイダンスによって、その印象的な一般化機能を実証した。
オープンコンテキストにSAMをアライメントするための自動プロンプトのための新しいフレームワークAlignSAMを提案する。
論文 参考訳(メタデータ) (2024-06-01T16:21:39Z) - GoodSAM: Bridging Domain and Capacity Gaps via Segment Anything Model for Distortion-aware Panoramic Semantic Segmentation [22.344399402787644]
本稿では,新しい課題に取り組み,新たなセグメンテーションモデル(SAM)から知識を伝達する方法について述べる。
そこで我々は,サンブルロジットを生成するためにSAMと統合された意味情報を提供する教師アシスタント(TA)を導入したGoodSAMというフレームワークを提案する。
2つのベンチマーク実験により、我々のGoodSAMは最先端(SOTA)ドメイン適応法よりも3.75%のmIoU改善を実現していることが示された。
論文 参考訳(メタデータ) (2024-03-25T02:30:32Z) - PosSAM: Panoptic Open-vocabulary Segment Anything [58.72494640363136]
PosSAMはオープン・ボキャブラリ・パノプティ・セグメンテーション・モデルであり、Segment Anything Model(SAM)の強みを、エンドツーエンドのフレームワークで視覚ネイティブのCLIPモデルと統合する。
本稿では,マスクの質を適応的に向上し,各画像の推論中にオープン語彙分類の性能を高めるマスク対応選択組立アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-14T17:55:03Z) - SFC: Shared Feature Calibration in Weakly Supervised Semantic
Segmentation [28.846513129022803]
画像レベルの教師付きセマンティックセグメンテーションはアノテーションコストの低さから注目されている。
既存の手法は主にクラスマッピング(CAM)に頼り、セマンティックセグメンテーションモデルをトレーニングするための擬似ラベルを得る。
本研究は,学習データにおける長い尾の分布が,ヘッドクラスとテールクラス間の共有特徴により,ヘッドクラスとアンダークラスの重みを過剰に活性化し,テールクラスとアンダークラスの重み付けによって計算されたCAMを生じさせることを示す最初の試みである。
論文 参考訳(メタデータ) (2024-01-22T06:43:13Z) - Stable Segment Anything Model [79.9005670886038]
SAM(Segment Anything Model)は、高品質なプロンプトが与えられた場合、顕著に迅速なセグメンテーションを実現する。
本稿では,SAMのセグメンテーション安定性について,多様なプロンプト特性のスペクトルにわたって包括的解析を行った。
1)SAMのセグメンテーション安定性を広範囲に改善し,2)SAMの強力なセグメンテーション効率と一般化を維持した。
論文 参考訳(メタデータ) (2023-11-27T12:51:42Z) - Task-Oriented Channel Attention for Fine-Grained Few-Shot Classification [5.4352987210173955]
Task Discrepancy Maximization (TDM) はタスク指向のチャネルアテンション手法であり、微粒な小ショット分類に適したものである。
QAMはクエリのオブジェクト関連チャネルにより高い重みを割り当てている。
これらのサブモジュールに基づいて、TDMは、クラス識別の詳細を符号化し、クエリが保持するチャネルに焦点を当て、タスク適応機能を生成する。
論文 参考訳(メタデータ) (2023-07-28T08:40:23Z) - PatchMix Augmentation to Identify Causal Features in Few-shot Learning [55.64873998196191]
少ないショット学習は、十分なカテゴリをラベル付けしたデータに基づいて学習した知識を、少ない既知の情報を持つ新しいカテゴリに転送することを目的としている。
我々はPatchMixと呼ばれる新しいデータ拡張戦略を提案し、この急激な依存関係を壊すことができる。
このような拡張メカニズムが,既存のメカニズムと異なり,因果的特徴を識別可能であることを示す。
論文 参考訳(メタデータ) (2022-11-29T08:41:29Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Revisiting Unsupervised Meta-Learning: Amplifying or Compensating for
the Characteristics of Few-Shot Tasks [30.893785366366078]
我々は,限られたデータを用いて視覚認識システムを構築する,少数ショット画像分類への実践的アプローチを開発した。
基本クラスセットラベルは不要であり、識別的埋め込みは教師なしの方法でメタ学習される可能性がある。
数ショットの学習ベンチマークの実験では、従来の手法よりも4~10%のパフォーマンス差で、アプローチが優れていることが確認された。
論文 参考訳(メタデータ) (2020-11-30T10:08:35Z) - A Few-Shot Sequential Approach for Object Counting [63.82757025821265]
画像中のオブジェクトに逐次出席するクラスアテンション機構を導入し,それらの特徴を抽出する。
提案手法は点レベルのアノテーションに基づいて訓練され,モデルのクラス依存的・クラス依存的側面を乱す新しい損失関数を用いる。
本稿では,FSODやMS COCOなど,さまざまなオブジェクトカウント/検出データセットについて報告する。
論文 参考訳(メタデータ) (2020-07-03T18:23:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。