論文の概要: Reflection Invariance Learning for Few-shot Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2309.15850v1
- Date: Thu, 1 Jun 2023 15:14:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 06:06:22.309023
- Title: Reflection Invariance Learning for Few-shot Semantic Segmentation
- Title(参考訳): 少数ショット意味セグメンテーションのための反射不変性学習
- Authors: Qinglong Cao, Yuntian Chen, Chao Ma, Xiaokang Yang
- Abstract要約: Few-shot semantic segmentation (FSS) は、いくつかのアノテーション付きサポートイメージを持つクエリイメージにおいて、目に見えないクラスのオブジェクトをセグメントすることを目的としている。
本稿では,マルチビューマッチング方式でリフレクション不変性をマイニングするための,新しい数ショットセグメンテーションフレームワークを提案する。
PASCAL-$5textiti$とCOCO-$20textiti$データセットの実験は、我々のアプローチの有効性を実証している。
- 参考スコア(独自算出の注目度): 53.20466630330429
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot semantic segmentation (FSS) aims to segment objects of unseen
classes in query images with only a few annotated support images. Existing FSS
algorithms typically focus on mining category representations from the
single-view support to match semantic objects of the single-view query.
However, the limited annotated samples render the single-view matching struggle
to perceive the reflection invariance of novel objects, which results in a
restricted learning space for novel categories and further induces a biased
segmentation with demoted parsing performance. To address this challenge, this
paper proposes a fresh few-shot segmentation framework to mine the reflection
invariance in a multi-view matching manner. Specifically, original and
reflection support features from different perspectives with the same semantics
are learnable fused to obtain the reflection invariance prototype with a
stronger category representation ability. Simultaneously, aiming at providing
better prior guidance, the Reflection Invariance Prior Mask Generation (RIPMG)
module is proposed to integrate prior knowledge from different perspectives.
Finally, segmentation predictions from varying views are complementarily merged
in the Reflection Invariance Semantic Prediction (RISP) module to yield precise
segmentation predictions. Extensive experiments on both PASCAL-$5^\textit{i}$
and COCO-$20^\textit{i}$ datasets demonstrate the effectiveness of our approach
and show that our method could achieve state-of-the-art performance. Code is
available at \url{https://anonymous.4open.science/r/RILFS-A4D1}
- Abstract(参考訳): 少数ショットセマンティクスセグメンテーション(英語版)(fss)は、わずかな注釈付きサポートイメージでクエリ画像内の未認識クラスのオブジェクトをセグメンテーションすることを目的としている。
既存のfssアルゴリズムは通常、シングルビューのサポートからカテゴリ表現をマイニングして、シングルビュークエリのセマンティックオブジェクトにマッチさせる。
しかし、注釈付きサンプルの限定は、新しい対象の反射不変性を知覚するために、単一ビューマッチングの苦労を生かし、その結果、新しいカテゴリーの学習スペースが制限され、さらに解析性能が低下した偏りのセグメンテーションが引き起こされる。
この課題に対処するために,マルチビューマッチング方式でリフレクション不変性をマイニングする,新しい数ショットセグメンテーションフレームワークを提案する。
具体的には、同じ意味を持つ異なる視点からのオリジナルおよびリフレクション支援機能を学習し、より強力なカテゴリ表現能力を持つリフレクション不変のプロトタイプを得る。
同時に、より優れた事前ガイダンスの提供を目指して、異なる視点からの事前知識を統合するために、反射不変性優先マスク生成(ripmg)モジュールを提案する。
最後に、様々なビューからのセグメンテーション予測をreflection invariance semantic prediction (risp)モジュールに相補的にマージし、正確なセグメンテーション予測を得る。
PASCAL-$5^\textit{i}$およびCOCO-$20^\textit{i}$データセットの大規模な実験は、我々のアプローチの有効性を示し、我々の手法が最先端のパフォーマンスを達成できることを示す。
コードは \url{https://anonymous.4open.science/r/RILFS-A4D1} で入手できる。
関連論文リスト
- Towards Flexible Interactive Reflection Removal with Human Guidance [75.38207315080624]
単一の画像反射除去は本質的に不明瞭であり、分離を必要とする反射成分と透過成分の両方が自然な画像統計に従う可能性がある。
既存の手法では、様々な種類の低レベルおよび物理ベースのキューを反射信号の源として利用することでこの問題に対処しようとする。
本稿では,様々な形態のスパース・ヒューマン・ガイダンスを活用するフレキシブル・インタラクティブ・リフレクション・リフレクション・リフレクション・リフレクション・リジェクション・リジェクション・アプローチを提案する。
論文 参考訳(メタデータ) (2024-06-03T17:34:37Z) - Few-Shot Rotation-Invariant Aerial Image Semantic Segmentation [53.47160182465171]
空中画像のセグメンテーションは、クエリーされた空中画像のオブジェクトを正確に解析する難しい作業である。
著者らは,FRINet(FriNet)の新規な数発回転不変空中セマンティックセマンティックセグメンテーションネットワークを提案する。
実験により、FRINetは数発の空中セマンティックセグメンテーションベンチマークで最先端の性能を達成することが示された。
論文 参考訳(メタデータ) (2023-05-29T09:28:34Z) - CAD: Co-Adapting Discriminative Features for Improved Few-Shot
Classification [11.894289991529496]
少数のラベル付きサンプルを与えられた未確認のクラスに適応できるモデルを学ぶことを目的としている。
最近のアプローチでは、特徴抽出器を事前訓練し、その後、エピソードなメタラーニングのための微調整を行う。
本研究は, 複数ショットの分類において, 横断的および再重み付き識別機能を実現するための戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T06:14:51Z) - Self-Supervised Learning Disentangled Group Representation as Feature [82.07737719232972]
既存の自己監督学習(SSL)は、回転や着色などの単純な拡張機能のみを分解することを示す。
反復的分割に基づく不変リスク最小化(IP-IRM)を提案する。
我々は、IP-IRMが完全に不整合表現に収束し、様々なベンチマークでその効果を示すことを証明した。
論文 参考訳(メタデータ) (2021-10-28T16:12:33Z) - Self-Guided and Cross-Guided Learning for Few-Shot Segmentation [12.899804391102435]
単発セグメンテーションのための自己誘導学習手法を提案する。
注釈付き支持画像の初期予測を行うことにより、被覆および検出された前景領域を一次および補助支持ベクトルに符号化する。
プライマリサポートベクターと補助サポートベクターの両方を集約することで、クエリイメージ上でより良いセグメンテーション性能が得られます。
論文 参考訳(メタデータ) (2021-03-30T07:36:41Z) - Demystifying Contrastive Self-Supervised Learning: Invariances,
Augmentations and Dataset Biases [34.02639091680309]
近年のパフォーマンス向上は、インスタンス分類モデルをトレーニングし、各イメージを扱い、拡張バージョンを単一のクラスのサンプルとして扱うことで実現している。
我々は,MOCO や PIRL のようなアプローチがオクルージョン不変表現を学習することを示した。
第2に、Imagenetのようなクリーンなオブジェクト中心のトレーニングデータセットにアクセスすることで、これらのアプローチがさらに利益を得ることを示す。
論文 参考訳(メタデータ) (2020-07-28T00:11:31Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z) - Self-Supervised Tuning for Few-Shot Segmentation [82.32143982269892]
Few-shotのセグメンテーションは、アノテートされたサンプルがほとんどない各画像ピクセルにカテゴリラベルを割り当てることを目的としている。
既存のメタラーニング手法では, 画像から抽出した視覚的特徴を埋め込み空間に埋め込むと, カテゴリー別識別記述子の生成に失敗する傾向にある。
本稿では,複数のエピソードにまたがる潜在特徴の分布を,自己分割方式に基づいて動的に調整する適応型フレームワークチューニングを提案する。
論文 参考訳(メタデータ) (2020-04-12T03:53:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。