論文の概要: Feature-Proxy Transformer for Few-Shot Segmentation
- arxiv url: http://arxiv.org/abs/2210.06908v1
- Date: Thu, 13 Oct 2022 11:22:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 16:26:42.586180
- Title: Feature-Proxy Transformer for Few-Shot Segmentation
- Title(参考訳): マイトショットセグメンテーション用フィーチャープロキシトランス
- Authors: Jian-Wei Zhang, Yifan Sun, Yi Yang, Wei Chen
- Abstract要約: Few-shot segmentation (FSS) は、いくつかのアノテーション付きサポートサンプルが与えられた新しいクラスでセマンティックセマンティックセマンティックセマンティクスを実行することを目的としている。
本稿では、線形分類ヘッドのセマンティッククラスを表すベクトルである「プロキシ」を特徴量変換器(FPTrans)法を提案する。
フレームワークは単純だが、FPTransは最先端デコーダ方式と同等に競合するFSS精度を実現する。
- 参考スコア(独自算出の注目度): 35.85575258482071
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot segmentation (FSS) aims at performing semantic segmentation on novel
classes given a few annotated support samples. With a rethink of recent
advances, we find that the current FSS framework has deviated far from the
supervised segmentation framework: Given the deep features, FSS methods
typically use an intricate decoder to perform sophisticated pixel-wise
matching, while the supervised segmentation methods use a simple linear
classification head. Due to the intricacy of the decoder and its matching
pipeline, it is not easy to follow such an FSS framework. This paper revives
the straightforward framework of "feature extractor $+$ linear classification
head" and proposes a novel Feature-Proxy Transformer (FPTrans) method, in which
the "proxy" is the vector representing a semantic class in the linear
classification head. FPTrans has two keypoints for learning discriminative
features and representative proxies: 1) To better utilize the limited support
samples, the feature extractor makes the query interact with the support
features from the bottom to top layers using a novel prompting strategy. 2)
FPTrans uses multiple local background proxies (instead of a single one)
because the background is not homogeneous and may contain some novel foreground
regions. These two keypoints are easily integrated into the vision transformer
backbone with the prompting mechanism in the transformer. Given the learned
features and proxies, FPTrans directly compares their cosine similarity for
segmentation. Although the framework is straightforward, we show that FPTrans
achieves competitive FSS accuracy on par with state-of-the-art decoder-based
methods.
- Abstract(参考訳): Few-shot segmentation (FSS) は、いくつかのアノテーション付きサポートサンプルが与えられた新しいクラスでセマンティックセグメンテーションを実行することを目的としている。
最近の進歩を再考すると、現在のFSSフレームワークは教師付きセグメンテーションフレームワークから遠く離れていることが分かる: 深い特徴を考えると、FSSメソッドは通常、複雑なデコーダを使用して高度なピクセルワイズマッチングを行い、教師付きセグメンテーションメソッドは単純な線形分類ヘッドを使用する。
デコーダとそのマッチングパイプラインの複雑さのため、このようなFSSフレームワークに従うのは容易ではない。
本稿では,「特徴抽出器$+$線形分類ヘッド」の素直な枠組みを復活させ,線形分類ヘッドにおける意味クラスを表すベクトルを「プロキシ」と呼ぶ新しい特徴-プロキシ変換器(FPTrans)法を提案する。
FPTransには、識別的特徴と代表的なプロキシを学ぶための2つのキーポイントがある。
1) 限られたサポートサンプルをより有効活用するために, 特徴抽出器は, 新規なプロンプト戦略を用いて, 下位層から上位層までのサポート機能とクエリを対話させる。
2)FPTransは,背景が均一ではなく,新しい前景領域を含む可能性があるため,複数の局所的背景プロキシを使用する。
これら2つのキーポイントは、インバータのプロンプト機構により、容易にビジョントランスバータバックボーンに統合される。
学習した特徴とプロキシから、FPTransはコサインの類似性をセグメンテーションと直接比較する。
フレームワークは単純だが、FPTransは最先端デコーダ方式と同等に競合するFSS精度を実現する。
関連論文リスト
- CMFDFormer: Transformer-based Copy-Move Forgery Detection with Continual
Learning [52.72888626663642]
コピーモーブ偽造検出は、疑わしい偽画像中の重複領域を検出することを目的としている。
深層学習に基づく複写偽造検出手法が最上位にある。
CMFDFormer という名称の Transformer-style copy-move forgery ネットワークを提案する。
また、CMFDFormerが新しいタスクを処理できるように、新しいPCSD連続学習フレームワークを提供する。
論文 参考訳(メタデータ) (2023-11-22T09:27:46Z) - Retro-FPN: Retrospective Feature Pyramid Network for Point Cloud
Semantic Segmentation [65.78483246139888]
本稿では,各点特徴量の予測を明示的かつふりかえり的な精錬プロセスとしてモデル化するRetro-FPNを提案する。
その重要な斬新さは、前層から意味コンテキストを要約するレトロ・トランスフォーマーである。
Retro-FPNは最先端のバックボーンよりも性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-08-18T05:28:25Z) - SegT: A Novel Separated Edge-guidance Transformer Network for Polyp
Segmentation [10.144870911523622]
本稿では, 効率的なポリープ分割モデルを構築することを目的とした, エッジ誘導変換器 (SegT) ネットワークを提案する。
既存のCNNベースのアプローチよりも堅牢な表現を学習するトランスフォーマーエンコーダが特に適用された。
SegTの有効性を評価するために、5つの挑戦的な公開データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2023-06-19T08:32:05Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - TraSeTR: Track-to-Segment Transformer with Contrastive Query for
Instance-level Instrument Segmentation in Robotic Surgery [60.439434751619736]
そこで我々は,TraSeTRを提案する。TraSeTR,TraSeTR,Trace-to-Segment Transformerは,手術器具のセグメンテーションを支援する。
TraSeTRは、機器の種類、位置、アイデンティティとインスタンスレベルの予測を共同で理由付けている。
提案手法の有効性を,3つの公開データセットに対して,最先端の計器型セグメンテーション結果を用いて実証した。
論文 参考訳(メタデータ) (2022-02-17T05:52:18Z) - Query2Label: A Simple Transformer Way to Multi-Label Classification [37.206922180245265]
本稿では,多ラベル分類問題に対する単純かつ効果的なアプローチを提案する。
提案手法はTransformerデコーダを用いてクラスラベルの存在を問い合わせる。
以前の作業と比較すると、新しいフレームワークはシンプルで、標準的なトランスフォーマーとビジョンバックボーンを使用し、効果的である。
論文 参考訳(メタデータ) (2021-07-22T17:49:25Z) - TrTr: Visual Tracking with Transformer [29.415900191169587]
トランスフォーマーエンコーダデコーダアーキテクチャと呼ばれる強力な注意メカニズムに基づく新しいトラッカーネットワークを提案する。
形状非依存アンカーに基づくターゲットのローカライズを行うトランスの出力を用いて,分類と回帰ヘッドを設計する。
本手法は最先端のアルゴリズムに好適に作用する。
論文 参考訳(メタデータ) (2021-05-09T02:32:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。