論文の概要: CATrans: Context and Affinity Transformer for Few-Shot Segmentation
- arxiv url: http://arxiv.org/abs/2204.12817v1
- Date: Wed, 27 Apr 2022 10:20:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-28 19:43:37.165987
- Title: CATrans: Context and Affinity Transformer for Few-Shot Segmentation
- Title(参考訳): catrans: マイナショットセグメンテーションのためのコンテキストとアフィニティトランスフォーマ
- Authors: Shan Zhang, Tianyi Wu, Sitong Wu, Guodong Guo
- Abstract要約: Few-shot segmentation (FSS) は、注釈付きサポート画像が不足している場合に、新しいカテゴリを分割することを目的としている。
本研究では,提案するコンテキスト・アフィニティ変換器を用いて,コンテキスト・アフィニティ情報を効果的に統合する。
提案手法の有効性を実証するために実験を行い,最先端の手法よりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 36.802347383825705
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot segmentation (FSS) aims to segment novel categories given scarce
annotated support images. The crux of FSS is how to aggregate dense
correlations between support and query images for query segmentation while
being robust to the large variations in appearance and context. To this end,
previous Transformer-based methods explore global consensus either on context
similarity or affinity map between support-query pairs. In this work, we
effectively integrate the context and affinity information via the proposed
novel Context and Affinity Transformer (CATrans) in a hierarchical
architecture. Specifically, the Relation-guided Context Transformer (RCT)
propagates context information from support to query images conditioned on more
informative support features. Based on the observation that a huge feature
distinction between support and query pairs brings barriers for context
knowledge transfer, the Relation-guided Affinity Transformer (RAT) measures
attention-aware affinity as auxiliary information for FSS, in which the
self-affinity is responsible for more reliable cross-affinity. We conduct
experiments to demonstrate the effectiveness of the proposed model,
outperforming the state-of-the-art methods.
- Abstract(参考訳): Few-shot segmentation (FSS) は、注釈付きサポート画像が不足している場合に、新しいカテゴリを分割することを目的としている。
FSSの要点は、外見とコンテキストの大きなバリエーションに対して堅牢でありながら、クエリセグメンテーションのためのサポートとクエリイメージの間に密接な相関関係を集約する方法である。
この目的のために、以前のトランスフォーマーベースの手法は、サポートクエリペア間のコンテキスト類似性または親和性マップに基づいて、グローバルコンセンサスを探索する。
本研究では, 階層型アーキテクチャにおいて, 提案する新しいコンテキスト・アフィニティ変換器(CATrans)を用いて, コンテキスト・アフィニティ情報を効果的に統合する。
具体的には、Relation-guided Context Transformer (RCT)は、サポートからより情報的なサポート機能によって条件付けられたクエリイメージまで、コンテキスト情報を伝達する。
サポートとクエリペア間の大きな特徴の区別が文脈知識伝達の障壁をもたらすという観測に基づいて、relation-guided affinity transformer(rat)は、自己親和性がより信頼性の高いクロス親和性に責任を持つfssの補助情報として注意意識親和性を測定する。
提案手法の有効性を実証する実験を行い,最先端手法を上回った。
関連論文リスト
- FCC: Fully Connected Correlation for Few-Shot Segmentation [11.277022867553658]
Few-shot segmentation (FSS) は、少数のサポートイメージとマスクのみを使用して、ターゲットオブジェクトをクエリイメージにセグメントすることを目的としている。
従来の手法では, 最終層や同層の特徴に対する画素レベルの相関関係から相関写像を作成することで, 事前情報を得る方法が試みられている。
サポート機能とクエリ機能の間にピクセルレベルの相関関係を統合するためにFCC(Fully Connected correlation)を導入する。
論文 参考訳(メタデータ) (2024-11-18T03:32:02Z) - Cross-Domain Few-Shot Segmentation via Iterative Support-Query
Correspondence Mining [81.09446228688559]
Cross-Domain Few-Shots (CD-FSS) は、限定された例のみを用いて、異なるドメインから新しいカテゴリを分割するという課題を提起する。
本稿では,CD-FSSの課題に対処する新しいクロスドメイン微調整手法を提案する。
論文 参考訳(メタデータ) (2024-01-16T14:45:41Z) - Dense Affinity Matching for Few-Shot Segmentation [83.65203917246745]
Few-Shot (FSS) は、新しいクラスイメージをいくつかのサンプルで分割することを目的としている。
本稿では,サポートクエリ間の相互作用を生かした密接な親和性マッチングフレームワークを提案する。
我々のフレームワークは0.68万のパラメータしか持たない異なる設定で非常に競争力のある性能を示す。
論文 参考訳(メタデータ) (2023-07-17T12:27:15Z) - Multi-Content Interaction Network for Few-Shot Segmentation [37.80624074068096]
Few-Shot COCOは、サポート画像の制限とクラス内における大きな相違に挑戦している。
この問題を解決するために,MCINet(Multi-Content Interaction Network)を提案する。
MCINetは、他のクエリブランチから低レベルの構造情報を高レベルのセマンティック機能に組み込むことで、FSSを改善している。
論文 参考訳(メタデータ) (2023-03-11T04:21:59Z) - FECANet: Boosting Few-Shot Semantic Segmentation with Feature-Enhanced
Context-Aware Network [48.912196729711624]
Few-shot セマンティックセグメンテーション(Few-shot semantic segmentation)は、新しいクラスの各ピクセルを、わずかに注釈付きサポートイメージで検索するタスクである。
本稿では,クラス間の類似性に起因するマッチングノイズを抑制するために,機能拡張コンテキスト認識ネットワーク(FECANet)を提案する。
さらに,前景と背景の余分な対応関係を符号化する新たな相関再構成モジュールを提案する。
論文 参考訳(メタデータ) (2023-01-19T16:31:13Z) - Few-shot Semantic Segmentation with Support-induced Graph Convolutional
Network [28.46908214462594]
Few-shot semantic segmentation (FSS) は、いくつかの注釈付きサンプルで新しいオブジェクトのセグメンテーションを実現することを目的としている。
本稿では,クエリ画像中の遅延コンテキスト構造を明示的に抽出するために,Support-induced Graph Convolutional Network (SiGCN)を提案する。
論文 参考訳(メタデータ) (2023-01-09T08:00:01Z) - Mining Relations among Cross-Frame Affinities for Video Semantic
Segmentation [87.4854250338374]
関連性間の関係を, 単一スケールの内在的相関と多スケールの関係という2つの側面で検討する。
実験により,提案手法は最先端のVSS法に対して好適に動作することを示した。
論文 参考訳(メタデータ) (2022-07-21T12:12:36Z) - Semantic-aligned Fusion Transformer for One-shot Object Detection [18.58772037047498]
ワンショットオブジェクト検出は、与えられた1つのインスタンスに従って新しいオブジェクトを検出することを目的としている。
現在のアプローチでは、直接転送可能なメタ知識を得るために様々な特徴融合を探索している。
本稿では,これらの問題を解決するために,Semantic-aligned Fusion Transformer (SaFT) というシンプルなアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-03-17T05:38:47Z) - Inter-class Discrepancy Alignment for Face Recognition [55.578063356210144]
IA(Inter-class DiscrepancyAlignment)という統合フレームワークを提案する。
IDA-DAOは、画像と隣人の相違を考慮した類似度スコアの整合に使用される。
IDA-SSEは、GANで生成された仮想候補画像を導入することで、説得力のあるクラス間隣人を提供できます。
論文 参考訳(メタデータ) (2021-03-02T08:20:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。