論文の概要: Attentional Prototype Inference for Few-Shot Segmentation
- arxiv url: http://arxiv.org/abs/2105.06668v3
- Date: Tue, 30 May 2023 01:28:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 12:03:40.352271
- Title: Attentional Prototype Inference for Few-Shot Segmentation
- Title(参考訳): 少数ショットセグメンテーションのための注意深いプロトタイプ推論
- Authors: Haoliang Sun, Xiankai Lu, Haochen Wang, Yilong Yin, Xiantong Zhen,
Cees G. M. Snoek, and Ling Shao
- Abstract要約: 数発のセグメンテーションのための確率的潜在変数フレームワークである注意型プロトタイプ推論(API)を提案する。
我々は各オブジェクトカテゴリのプロトタイプを表現するためにグローバル潜在変数を定義し、確率分布としてモデル化する。
我々は4つのベンチマークで広範な実験を行い、提案手法は最先端のプロトタイプベースの手法よりも、少なくとも競争力があり、しばしば優れた性能が得られる。
- 参考スコア(独自算出の注目度): 128.45753577331422
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper aims to address few-shot segmentation. While existing
prototype-based methods have achieved considerable success, they suffer from
uncertainty and ambiguity caused by limited labeled examples. In this work, we
propose attentional prototype inference (API), a probabilistic latent variable
framework for few-shot segmentation. We define a global latent variable to
represent the prototype of each object category, which we model as a
probabilistic distribution. The probabilistic modeling of the prototype
enhances the model's generalization ability by handling the inherent
uncertainty caused by limited data and intra-class variations of objects. To
further enhance the model, we introduce a local latent variable to represent
the attention map of each query image, which enables the model to attend to
foreground objects while suppressing the background. The optimization of the
proposed model is formulated as a variational Bayesian inference problem, which
is established by amortized inference networks. We conduct extensive
experiments on four benchmarks, where our proposal obtains at least competitive
and often better performance than state-of-the-art prototype-based methods. We
also provide comprehensive analyses and ablation studies to gain insight into
the effectiveness of our method for few-shot segmentation.
- Abstract(参考訳): 本稿では,数発のセグメンテーションを提案する。
既存のプロトタイプベースの手法は大きな成功を収めているが、限定された例によって生じる不確実性と曖昧さに苦しめられている。
本研究では,少数ショットセグメンテーションのための確率潜在変数フレームワークである注意型プロトタイプ推論(API)を提案する。
我々は各オブジェクトカテゴリのプロトタイプを表現するためにグローバル潜在変数を定義し、確率分布としてモデル化する。
プロトタイプの確率論的モデリングは、限られたデータやクラス内の変化に起因する固有の不確実性を扱うことにより、モデルの一般化能力を高める。
このモデルをさらに強化するため,各問合せ画像のアテンションマップを表すローカル潜在変数を導入し,背景を抑えながら前景オブジェクトへの参照を可能にする。
提案モデルの最適化は変分ベイズ推論問題として定式化され, 償却推論ネットワークによって確立された。
我々は4つのベンチマークについて広範な実験を行い,提案手法は最先端のプロトタイプベース手法よりも,少なくとも競争性が高く,しばしば優れた性能を得る。
また,本手法の有効性を明らかにするため,包括的分析およびアブレーション研究も行った。
関連論文リスト
- Unleashing the Potential of the Diffusion Model in Few-shot Semantic Segmentation [56.87049651707208]
セマンティックはインコンテクストタスクへと発展し、一般化的セグメンテーションモデルを評価する上で重要な要素となった。
我々の最初の焦点は、クエリイメージとサポートイメージの相互作用を容易にする方法を理解することであり、その結果、自己注意フレームワーク内のKV融合法が提案される。
そこで我々はDiffewSというシンプルで効果的なフレームワークを構築し,従来の潜在拡散モデルの生成フレームワークを最大限に保持する。
論文 参考訳(メタデータ) (2024-10-03T10:33:49Z) - Multi-Scale Grouped Prototypes for Interpretable Semantic Segmentation [7.372346036256517]
意味的セグメンテーションを解釈可能なものにするための、有望なアプローチとして、プロトタイプ的な部分学習が登場している。
本稿では,多スケール画像表現を利用した意味的セグメンテーションの解釈手法を提案する。
Pascal VOC,Cityscapes,ADE20Kで行った実験により,提案手法はモデルの疎結合性を高め,既存のプロトタイプ手法よりも解釈可能性を高め,非解釈可能なモデルとの性能ギャップを狭めることを示した。
論文 参考訳(メタデータ) (2024-09-14T17:52:59Z) - Out-of-Distribution Detection via Deep Multi-Comprehension Ensemble [11.542472900306745]
マルチComprehension (MC) Ensemble は,OOD (Out-of-Distribution) 特徴表現を拡大するための戦略として提案されている。
OOD検出におけるMC Ensemble戦略の優れた性能を示す実験結果を得た。
これにより,提案手法がトレーニング分布外のインスタンスを検出できるモデルの性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2024-03-24T18:43:04Z) - An Additive Instance-Wise Approach to Multi-class Model Interpretation [53.87578024052922]
解釈可能な機械学習は、ブラックボックスシステムの特定の予測を駆動する要因に関する洞察を提供する。
既存の手法は主に、局所的な加法的あるいはインスタンス的なアプローチに従う説明的入力特徴の選択に重点を置いている。
本研究は,両手法の長所を生かし,複数の対象クラスに対する局所的な説明を同時に学習するためのグローバルフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-07T06:50:27Z) - A General Divergence Modeling Strategy for Salient Object Detection [32.53501439077824]
有能な物体検出は本質的に主観的であり、複数の推定値が同一の入力画像と関連していることが示唆される。
既存の有意なオブジェクト検出モデルは、点から点までの推定に従って決定論的であり、予測分布を推定できない。
潜在変数モデルに基づく予測ネットワークは予測変種をモデル化するために存在するが、単一の清浄度に基づく潜時空間は、主観的な唾液度の性質を探索する上では信頼性が低い。
論文 参考訳(メタデータ) (2021-11-23T12:47:51Z) - A Prototype-Oriented Framework for Unsupervised Domain Adaptation [52.25537670028037]
メモリと計算効率のよい確率的フレームワークを提供し、クラスプロトタイプを抽出し、ターゲットとなる特徴をそれらと整合させる。
本稿では,単一ソース,マルチソース,クラス不均衡,ソースプライベートドメイン適応など,幅広いシナリオにおいて,本手法の汎用性を実証する。
論文 参考訳(メタデータ) (2021-10-22T19:23:22Z) - SCNet: Enhancing Few-Shot Semantic Segmentation by Self-Contrastive
Background Prototypes [56.387647750094466]
Few-shot セマンティックセマンティックセマンティクスは,クエリイメージ内の新規クラスオブジェクトを,アノテーション付きの例で分割することを目的としている。
先進的なソリューションのほとんどは、各ピクセルを学習した前景のプロトタイプに合わせることでセグメンテーションを行うメトリクス学習フレームワークを利用している。
このフレームワークは、前景プロトタイプのみとのサンプルペアの不完全な構築のために偏った分類に苦しんでいます。
論文 参考訳(メタデータ) (2021-04-19T11:21:47Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。