論文の概要: Eliminating Feature Ambiguity for Few-Shot Segmentation
- arxiv url: http://arxiv.org/abs/2407.09842v1
- Date: Sat, 13 Jul 2024 10:33:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 20:37:36.848262
- Title: Eliminating Feature Ambiguity for Few-Shot Segmentation
- Title(参考訳): Few-Shotセグメンテーションにおける特徴の曖昧さの排除
- Authors: Qianxiong Xu, Guosheng Lin, Chen Change Loy, Cheng Long, Ziyue Li, Rui Zhao,
- Abstract要約: マイクロショットセグメンテーション(FSS)の最近の進歩は、クエリとサポート機能の間のピクセル間マッチングを利用してきた。
本稿では,既存のクロスアテンションベースのFSS手法に接続可能な,新しいアンビグニティ除去ネットワーク(AENet)を提案する。
- 参考スコア(独自算出の注目度): 95.9916573435427
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in few-shot segmentation (FSS) have exploited pixel-by-pixel matching between query and support features, typically based on cross attention, which selectively activate query foreground (FG) features that correspond to the same-class support FG features. However, due to the large receptive fields in deep layers of the backbone, the extracted query and support FG features are inevitably mingled with background (BG) features, impeding the FG-FG matching in cross attention. Hence, the query FG features are fused with less support FG features, i.e., the support information is not well utilized. This paper presents a novel plug-in termed ambiguity elimination network (AENet), which can be plugged into any existing cross attention-based FSS methods. The main idea is to mine discriminative query FG regions to rectify the ambiguous FG features, increasing the proportion of FG information, so as to suppress the negative impacts of the doped BG features. In this way, the FG-FG matching is naturally enhanced. We plug AENet into three baselines CyCTR, SCCAN and HDMNet for evaluation, and their scores are improved by large margins, e.g., the 1-shot performance of SCCAN can be improved by 3.0%+ on both PASCAL-5$^i$ and COCO-20$^i$. The code is available at https://github.com/Sam1224/AENet.
- Abstract(参考訳): マイクロショットセグメンテーション(FSS)の最近の進歩は、クエリとサポート機能間のピクセル間マッチングを利用しており、通常はクロスアテンションに基づいて、同じクラスのサポートFG機能に対応するクエリフォアグラウンド(FG)機能を選択的に活性化している。
しかし,背骨の深層部における受容野が大きいため,抽出されたクエリとサポートFG機能は,必然的にバックグラウンド(BG)機能と混同され,FG-FGマッチングが横断的に阻害される。
したがって、クエリFG機能は、サポートFG機能が少なく、つまり、サポート情報が十分に活用されていない。
本稿では,既存のクロスアテンションベースのFSS手法に接続可能な,新しいアンビグニティ除去ネットワーク(AENet)を提案する。
主な考え方は、不明瞭なFG特徴を正すために識別クエリFG領域をマイニングし、FG情報の比率を高め、ドープされたBG特徴の負の影響を抑制することである。
このようにして、FG-FGマッチングが自然に強化される。
評価のためにAENetをCyCTR,SCCAN,HDMNetの3つのベースラインに接続し,そのスコアを大きなマージン,例えばPASCAL-5$^i$とCOCO-20$^i$で3.0%以上向上させることができる。
コードはhttps://github.com/Sam1224/AENetで公開されている。
関連論文リスト
- Segment to Recognize Robustly -- Enhancing Recognition by Image Decomposition [21.917582794820095]
S2R2(Segment to Recognize Robustly)は、FGとBGを分離し、それらをシンプルで堅牢で解釈可能な方法で結合する新しい認識手法である。
S2R2は、BGシフトに対する堅牢性を保ちながら、ドメイン内のデータに対する最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-11-24T17:39:39Z) - Fine-grained Background Representation for Weakly Supervised Semantic Segmentation [35.346567242839065]
本稿では,多様なBGセマンティクスを発見し,表現するために,FBR法を提案する。
そこで本研究では,FG陰性線を抽出し,地中コントラスト学習を効果的に行うためのアクティブサンプリング戦略を提案する。
本手法は,Pascal Voc および MS COCO テストセットにおいて,73.2 mIoU と 45.6 mIoU のセグメンテーション結果を得る。
論文 参考訳(メタデータ) (2024-06-22T06:45:25Z) - FG-Net: Facial Action Unit Detection with Generalizable Pyramidal
Features [13.176011491885664]
以前のAU検出方法はデータセットにオーバーフィットする傾向があり、コーパス間で評価された場合、大きなパフォーマンス損失が発生する。
一般化可能な顔行動単位検出のためのFG-Netを提案する。
具体的には、FG-Netは、大規模で多様な顔画像データセットで事前訓練されたStyleGAN2モデルから特徴マップを抽出する。
論文 参考訳(メタデータ) (2023-08-23T18:51:11Z) - Self-Calibrated Cross Attention Network for Few-Shot Segmentation [65.20559109791756]
我々は、パッチベースの効率的なアテンションのために、自己校正型クロスアテンション(SCCA)ブロックを設計する。
SCCAは、同じクエリイメージからのパッチと、サポートイメージからのアライメントパッチをK&Vとしてグループ化する。
このようにして、クエリBG機能はFGをサポートするBG機能と混同され、前述の問題が軽減される。
論文 参考訳(メタデータ) (2023-08-18T04:41:50Z) - Pair then Relation: Pair-Net for Panoptic Scene Graph Generation [54.92476119356985]
Panoptic Scene Graph (PSG) は、ボックスの代わりにパン光学セグメンテーションを使用して、より包括的なシーングラフ表現を作成することを目的としている。
現在のPSGメソッドは性能が限られており、下流のタスクやアプリケーションを妨げる。
Pair then Relation (Pair-Net) - Pair Proposal Network (PPN) を用いて、対象と対象間の疎対関係を学習・フィルタリングする。
論文 参考訳(メタデータ) (2023-07-17T17:58:37Z) - Global Hierarchical Attention for 3D Point Cloud Analysis [88.56041763189162]
我々は,GHA(Global Hierarchical Attention)と呼ばれる3Dポイントクラウド解析のための新しい注意機構を提案する。
セマンティックセグメンテーションのタスクでは、GHAはScanNet上のMinkowskiEngineベースラインに+1.7%のmIoU増加を与える。
3Dオブジェクト検出タスクでは、GHAはnuScenesデータセット上でCenterPointベースラインを+0.5%mAP改善する。
論文 参考訳(メタデータ) (2022-08-07T19:16:30Z) - Kernelized Multiplicative Weights for 0/1-Polyhedral Games: Bridging the
Gap Between Learning in Extensive-Form and Normal-Form Games [76.21916750766277]
カーネルトリックを用いて,最適乗算重み更新(OMWU)アルゴリズムをゲームツリーサイズ毎のリニア時間でEFGの正規形等価値にシミュレート可能であることを示す。
特に、KoMWUは、最終点収束を同時に保証する最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-02-01T06:28:51Z) - Channel DropBlock: An Improved Regularization Method for Fine-Grained
Visual Classification [58.07257910065007]
既存のアプローチは主に、識別的部分を見つけるための注意機構や、高度にパラメータ化された特徴を弱教師付きで抽出する特徴符号化アプローチを導入することでこの問題に対処している。
本研究では,CDB(Channel DropBlock)と呼ばれる軽量で効果的な正規化手法を提案する。
論文 参考訳(メタデータ) (2021-06-07T09:03:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。