論文の概要: Focus on Query: Adversarial Mining Transformer for Few-Shot Segmentation
- arxiv url: http://arxiv.org/abs/2311.17626v1
- Date: Wed, 29 Nov 2023 13:39:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-30 21:21:19.109589
- Title: Focus on Query: Adversarial Mining Transformer for Few-Shot Segmentation
- Title(参考訳): クエリに焦点をあてる: マイニングトランスフォーマーによるマイニング
- Authors: Yuan Wang, Naisong Luo, Tianzhu Zhang
- Abstract要約: Few-shot segmentation (FSS) は、注釈付きサンプルのみを与えられた新しいカテゴリのオブジェクトを分割することを目的としている。
我々は新しいクエリ中心FSSモデルAdrial Mining Transformer (AMFormer)を提案する。
AMFormerは、粗いサポートガイダンスや弱いサポートラベルだけで、正確なクエリイメージセグメンテーションを実現する。
- 参考スコア(独自算出の注目度): 44.778713276910715
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot segmentation (FSS) aims to segment objects of new categories given
only a handful of annotated samples. Previous works focus their efforts on
exploring the support information while paying less attention to the mining of
the critical query branch. In this paper, we rethink the importance of support
information and propose a new query-centric FSS model Adversarial Mining
Transformer (AMFormer), which achieves accurate query image segmentation with
only rough support guidance or even weak support labels. The proposed AMFormer
enjoys several merits. First, we design an object mining transformer (G) that
can achieve the expansion of incomplete region activated by support clue, and a
detail mining transformer (D) to discriminate the detailed local difference
between the expanded mask and the ground truth. Second, we propose to train G
and D via an adversarial process, where G is optimized to generate more
accurate masks approaching ground truth to fool D. We conduct extensive
experiments on commonly used Pascal-5i and COCO-20i benchmarks and achieve
state-of-the-art results across all settings. In addition, the decent
performance with weak support labels in our query-centric paradigm may inspire
the development of more general FSS models. Code will be available at
https://github.com/Wyxdm/AMNet.
- Abstract(参考訳): Few-shot segmentation (FSS) は、注釈付きサンプルのみを与えられた新しいカテゴリのオブジェクトを分割することを目的としている。
これまでの作業は、重要なクエリブランチのマイニングに注意を払わずに、サポート情報の探索に重点を置いていた。
本稿では、サポート情報の重要性を再考し、粗いサポートガイダンスや弱いサポートラベルだけで正確なクエリイメージセグメンテーションを実現する新しいクエリ中心のFSSモデルであるAdversarial Mining Transformer(AMFormer)を提案する。
提案されたAMFormerにはいくつかのメリットがある。
まず,支持手掛かりによって活性化される不完全領域の拡大を達成できる対象地雷変圧器(G)と,拡張マスクと地中真実との詳細な局所的差異を識別する詳細地雷変圧器(D)を設計する。
第2に、G と D の学習は、G がより正確なマスクを生成するように最適化され、D が愚かな真実に近づくように最適化され、よく使われる Pascal-5i と COCO-20i ベンチマークで広範な実験を行い、全ての設定において最先端の結果を得る。
さらに、クエリ中心のパラダイムにおけるサポートラベルの弱い適切なパフォーマンスは、より一般的なFSSモデルの開発を促します。
コードはhttps://github.com/wyxdm/amnetで入手できる。
関連論文リスト
- Visual Prompting for Generalized Few-shot Segmentation: A Multi-scale Approach [29.735863112700358]
本稿では,GFSSタスクにおいて,学習した視覚的プロンプトを用いたトランスフォーマーデコーダの有効性について検討する。
我々のゴールは、限られた例を持つ新しいカテゴリだけでなく、基本カテゴリにおけるパフォーマンスを維持することにある。
本稿では,新しいプロンプトと限られた例で学習したベースプロンプトと,豊富なデータで学習したベースプロンプトとの間に一方向因果注意機構を導入する。
論文 参考訳(メタデータ) (2024-04-17T20:35:00Z) - Progressively Dual Prior Guided Few-shot Semantic Segmentation [57.37506990980975]
Few-shotのセマンティックセマンティックセマンティクスタスクは、いくつかのアノテーション付きサポートサンプルを使用して、クエリイメージのセマンティクスを実行することを目的としている。
本稿では,先進的に2重にガイドされた数発のセマンティックセマンティックセグメンテーションネットワークを提案する。
論文 参考訳(メタデータ) (2022-11-20T16:19:47Z) - Intermediate Prototype Mining Transformer for Few-Shot Semantic
Segmentation [119.51445225693382]
Few-shotのセマンティックセマンティックセマンティクスは、いくつかのアノテーション付きサポートイメージの条件下で、ターゲットオブジェクトをクエリにセグメントすることを目的としている。
そこで本研究では,提案クエリから決定論的カテゴリ情報と適応的カテゴリ知識の両方をマイニングする中間プロトタイプを提案する。
各IPMT層では,サポート機能とクエリ機能の両方のオブジェクト情報をプロトタイプに伝達し,それを使ってクエリ機能マップを活性化する。
論文 参考訳(メタデータ) (2022-10-13T06:45:07Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Boosting Few-shot Semantic Segmentation with Transformers [81.43459055197435]
TRansformer-based Few-shot Semantic segmentation Method (TRFS)
我々のモデルは,グローバル・エンハンスメント・モジュール(GEM)とローカル・エンハンスメント・モジュール(LEM)の2つのモジュールから構成される。
論文 参考訳(メタデータ) (2021-08-04T20:09:21Z) - Self-Guided and Cross-Guided Learning for Few-Shot Segmentation [12.899804391102435]
単発セグメンテーションのための自己誘導学習手法を提案する。
注釈付き支持画像の初期予測を行うことにより、被覆および検出された前景領域を一次および補助支持ベクトルに符号化する。
プライマリサポートベクターと補助サポートベクターの両方を集約することで、クエリイメージ上でより良いセグメンテーション性能が得られます。
論文 参考訳(メタデータ) (2021-03-30T07:36:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。