論文の概要: Prototype Mixture Models for Few-shot Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2008.03898v2
- Date: Tue, 1 Sep 2020 11:23:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 22:56:15.196362
- Title: Prototype Mixture Models for Few-shot Semantic Segmentation
- Title(参考訳): Few-shot Semantic Segmentationのためのプロトタイプ混合モデル
- Authors: Boyu Yang, Chang Liu, Bohao Li, Jianbin Jiao, and Qixiang Ye
- Abstract要約: サポートやクエリ画像内のオブジェクトが外観やポーズで大きく異なる可能性があるため、ショットのセグメンテーションは難しい。
プロトタイプベースセマンティック表現を強制するために,多種多様な画像領域と複数のプロトタイプとの相関関係を持つプロトタイプ混合モデル(PMMs)を提案する。
PMMはMS-COCOの5ショットセグメンテーション性能を最大5.82%改善し、モデルサイズと推論速度の適度なコストに留まった。
- 参考スコア(独自算出の注目度): 50.866870384596446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot segmentation is challenging because objects within the support and
query images could significantly differ in appearance and pose. Using a single
prototype acquired directly from the support image to segment the query image
causes semantic ambiguity. In this paper, we propose prototype mixture models
(PMMs), which correlate diverse image regions with multiple prototypes to
enforce the prototype-based semantic representation. Estimated by an
Expectation-Maximization algorithm, PMMs incorporate rich channel-wised and
spatial semantics from limited support images. Utilized as representations as
well as classifiers, PMMs fully leverage the semantics to activate objects in
the query image while depressing background regions in a duplex manner.
Extensive experiments on Pascal VOC and MS-COCO datasets show that PMMs
significantly improve upon state-of-the-arts. Particularly, PMMs improve 5-shot
segmentation performance on MS-COCO by up to 5.82\% with only a moderate cost
for model size and inference speed.
- Abstract(参考訳): サポートやクエリ画像内のオブジェクトが外観やポーズで大きく異なる可能性があるため、ショットのセグメンテーションは難しい。
サポートイメージから直接取得した1つのプロトタイプを使用してクエリ画像をセグメント化すると、セマンティックなあいまいさが発生する。
本稿では,様々な画像領域と複数のプロトタイプを関連付けて,プロトタイプに基づく意味表現を実現するプロトタイプ混合モデル(pmms)を提案する。
期待最大化アルゴリズムにより推定されるPMMは、限られたサポート画像からリッチなチャネルワイドおよび空間意味を組み込む。
表現や分類器として利用され、PMMはセマンティクスをフル活用してクエリイメージ内のオブジェクトを活性化し、背景領域を二重に圧縮する。
Pascal VOCとMS-COCOデータセットの大規模な実験は、PMMが最先端の状況において著しく改善されていることを示している。
特に、PMMはモデルサイズと推論速度の適度なコストでMS-COCOの5ショットセグメンテーション性能を最大5.82\%向上させる。
関連論文リスト
- Correlation Weighted Prototype-based Self-Supervised One-Shot Segmentation of Medical Images [12.365801596593936]
医用画像セグメンテーションは、十分な注釈付きデータが入手できない領域の1つである。
スーパーピクセルから生成された擬似ラベルを用いた,プロトタイプベースのワンショット学習フレームワークを提案する。
提案手法は,最先端の手法と同等に機能することを示す。
論文 参考訳(メタデータ) (2024-08-12T15:38:51Z) - Matryoshka Multimodal Models [92.41824727506751]
我々はM3: Matryoshka Multimodal Modelsを提案する。
COCOスタイルのベンチマークでは,576個のトークンを使用する場合と同様の精度を得るために,9個のビジュアルトークンしか必要としないことがわかった。
論文 参考訳(メタデータ) (2024-05-27T17:59:56Z) - DEEM: Diffusion Models Serve as the Eyes of Large Language Models for Image Perception [66.88792390480343]
本稿では,拡散モデルの生成的フィードバックを利用して画像エンコーダのセマンティックな分布を整合させる,シンプルだが効果的なアプローチであるDEEMを提案する。
DEEMは、トレーニング可能なパラメータが少なく、事前学習データが少なく、ベースモデルのサイズが小さいことを利用して、モデル幻覚を軽減するために、強化された堅牢性と優れた能力を示す。
論文 参考訳(メタデータ) (2024-05-24T05:46:04Z) - Mask Matching Transformer for Few-Shot Segmentation [71.32725963630837]
Mask Matching Transformer (MM-Former) は、少数ショットセグメンテーションタスクのための新しいパラダイムである。
まず、MM-Formerは、まず分解し、次にブレンドするというパラダイムに従う。
一般的なCOCO-20i$とPascal-5i$ベンチマークに関する広範な実験を行っている。
論文 参考訳(メタデータ) (2022-12-05T11:00:32Z) - Boosting Few-shot Semantic Segmentation with Transformers [81.43459055197435]
TRansformer-based Few-shot Semantic segmentation Method (TRFS)
我々のモデルは,グローバル・エンハンスメント・モジュール(GEM)とローカル・エンハンスメント・モジュール(LEM)の2つのモジュールから構成される。
論文 参考訳(メタデータ) (2021-08-04T20:09:21Z) - SCNet: Enhancing Few-Shot Semantic Segmentation by Self-Contrastive
Background Prototypes [56.387647750094466]
Few-shot セマンティックセマンティックセマンティクスは,クエリイメージ内の新規クラスオブジェクトを,アノテーション付きの例で分割することを目的としている。
先進的なソリューションのほとんどは、各ピクセルを学習した前景のプロトタイプに合わせることでセグメンテーションを行うメトリクス学習フレームワークを利用している。
このフレームワークは、前景プロトタイプのみとのサンプルペアの不完全な構築のために偏った分類に苦しんでいます。
論文 参考訳(メタデータ) (2021-04-19T11:21:47Z) - SimPropNet: Improved Similarity Propagation for Few-shot Image
Segmentation [14.419517737536706]
最近のディープニューラルネットワークに基づくFSS法は,サポート画像の前景特徴とクエリ画像特徴との高次元的特徴類似性を生かしている。
我々は,サポート機能とクエリ機能との共有を強制するために,サポートとクエリマスクを共同で予測することを提案する。
提案手法は,PASCAL-5iデータセット上での1ショットと5ショットのセグメンテーションに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2020-04-30T17:56:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。