論文の概要: Few-Shot Segmentation via Rich Prototype Generation and Recurrent
Prediction Enhancement
- arxiv url: http://arxiv.org/abs/2210.00765v1
- Date: Mon, 3 Oct 2022 08:46:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 15:41:40.698299
- Title: Few-Shot Segmentation via Rich Prototype Generation and Recurrent
Prediction Enhancement
- Title(参考訳): リッチプロトタイプ生成と再帰予測強調による少数ショットセグメンテーション
- Authors: Hongsheng Wang, Xiaoqi Zhao, Youwei Pang, Jinqing Qi
- Abstract要約: 本稿では,プロトタイプ学習パラダイムを強化するために,リッチプロトタイプ生成モジュール (RPGM) と繰り返し予測拡張モジュール (RPEM) を提案する。
RPGMはスーパーピクセルとK平均クラスタリングを組み合わせて、補完的なスケール関係を持つリッチなプロトタイプ機能を生成する。
RPEMは、リカレントメカニズムを使用して、ラウンドウェイ伝搬デコーダを設計する。
- 参考スコア(独自算出の注目度): 12.614578133091168
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prototype learning and decoder construction are the keys for few-shot
segmentation. However, existing methods use only a single prototype generation
mode, which can not cope with the intractable problem of objects with various
scales. Moreover, the one-way forward propagation adopted by previous methods
may cause information dilution from registered features during the decoding
process. In this research, we propose a rich prototype generation module (RPGM)
and a recurrent prediction enhancement module (RPEM) to reinforce the prototype
learning paradigm and build a unified memory-augmented decoder for few-shot
segmentation, respectively. Specifically, the RPGM combines superpixel and
K-means clustering to generate rich prototype features with complementary scale
relationships and adapt the scale gap between support and query images. The
RPEM utilizes the recurrent mechanism to design a round-way propagation
decoder. In this way, registered features can provide object-aware information
continuously. Experiments show that our method consistently outperforms other
competitors on two popular benchmarks PASCAL-${{5}^{i}}$ and COCO-${{20}^{i}}$.
- Abstract(参考訳): プロトタイプ学習とデコーダ構築は、少数ショットセグメンテーションの鍵である。
しかし、既存の手法では1つのプロトタイプ生成モードしか使用せず、様々なスケールのオブジェクトの難解な問題に対処できない。
さらに、先行手法で採用されている一方向前方伝播は、復号処理中に登録された特徴から情報希釈を引き起こす可能性がある。
本研究では,プロトタイプ学習パラダイムを補強し,数ショットセグメンテーションのための統合メモリ型デコーダを構築するために,リッチプロトタイプ生成モジュール (rpgm) とリカレント予測拡張モジュール (rpem) を提案する。
具体的には、rpgmはsuperpixelとk-meansクラスタリングを組み合わせることで、補完的なスケール関係を持つリッチなプロトタイプ機能を生成し、サポートとクエリ画像間のスケールギャップを適応させる。
RPEMは、リカレントメカニズムを使用して、ラウンドウェイ伝搬デコーダを設計する。
このように登録された機能はオブジェクト認識情報を継続的に提供することができる。
実験の結果,この手法はPASCAL-${5}^{i}}$とCOCO-${20}^{i}}$の2つのベンチマークにおいて,他の競合よりも一貫して優れていた。
関連論文リスト
- Multi-Scale Grouped Prototypes for Interpretable Semantic Segmentation [7.372346036256517]
意味的セグメンテーションを解釈可能なものにするための、有望なアプローチとして、プロトタイプ的な部分学習が登場している。
本稿では,多スケール画像表現を利用した意味的セグメンテーションの解釈手法を提案する。
Pascal VOC,Cityscapes,ADE20Kで行った実験により,提案手法はモデルの疎結合性を高め,既存のプロトタイプ手法よりも解釈可能性を高め,非解釈可能なモデルとの性能ギャップを狭めることを示した。
論文 参考訳(メタデータ) (2024-09-14T17:52:59Z) - Query-guided Prototype Evolution Network for Few-Shot Segmentation [85.75516116674771]
本稿では,前景と背景のプロトタイプの生成プロセスにクエリ機能を統合する新しい手法を提案する。
PASCAL-$5i$とミラーリング-$20i$データセットの実験結果は、QPENetが達成した実質的な拡張を示している。
論文 参考訳(メタデータ) (2024-03-11T07:50:40Z) - Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Multimodal Prototype-Enhanced Network for Few-Shot Action Recognition [40.329190454146996]
MultimOdal PRototype-ENhanced Network (MORN)は、ラベルテキストの意味情報をマルチモーダル情報として利用してプロトタイプを強化する。
我々は4つの一般的な数発のアクション認識データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-12-09T14:24:39Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。
我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。
この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文 参考訳(メタデータ) (2022-03-28T21:15:32Z) - Contrastive Enhancement Using Latent Prototype for Few-Shot Segmentation [8.986743262828009]
短いショットのセグメンテーションにより、アノテーション付きの例がほとんどない未確認のクラスを認識できる。
本稿では,潜伏クラスを活用するために潜伏型プロトタイプを用いた対照的な拡張手法を提案する。
提案手法は,1ショットと5ショットのセグメンテーションにおける最先端手法の性能を著しく向上させる。
論文 参考訳(メタデータ) (2022-03-08T14:02:32Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。