Fugu-MT 論文翻訳(概要): MaskDiff: Modeling Mask Distribution with Diffusion Probabilistic Model for Few-Shot Instance Segmentation

論文の概要: MaskDiff: Modeling Mask Distribution with Diffusion Probabilistic Model for Few-Shot Instance Segmentation

arxiv url: http://arxiv.org/abs/2303.05105v2
Date: Sun, 21 Jan 2024 23:04:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-23 22:16:01.843368
Title: MaskDiff: Modeling Mask Distribution with Diffusion Probabilistic Model for Few-Shot Instance Segmentation
Title（参考訳）: maskdiff: 拡散確率モデルを用いた少数インスタンスセグメンテーションのためのマスク分布のモデル化
Authors: Minh-Quan Le, Tam V. Nguyen, Trung-Nghia Le, Thanh-Toan Do, Minh N. Do, Minh-Triet Tran
Abstract要約: 少数ショットのインスタンスセグメンテーションは、数ショットの学習パラダイムをインスタンスセグメンテーションタスクに拡張する。従来のアプローチでは、ポイント推定と呼ばれるプロトタイプ学習を通じてその課題に対処しようと試みてきた。本稿では,二項マスクの条件分布をモデル化したMaskDiffという新しい手法を提案する。
参考スコア（独自算出の注目度）: 31.648523213206595
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Few-shot instance segmentation extends the few-shot learning paradigm to the instance segmentation task, which tries to segment instance objects from a query image with a few annotated examples of novel categories. Conventional approaches have attempted to address the task via prototype learning, known as point estimation. However, this mechanism depends on prototypes (\eg mean of $K-$shot) for prediction, leading to performance instability. To overcome the disadvantage of the point estimation mechanism, we propose a novel approach, dubbed MaskDiff, which models the underlying conditional distribution of a binary mask, which is conditioned on an object region and $K-$shot information. Inspired by augmentation approaches that perturb data with Gaussian noise for populating low data density regions, we model the mask distribution with a diffusion probabilistic model. We also propose to utilize classifier-free guided mask sampling to integrate category information into the binary mask generation process. Without bells and whistles, our proposed method consistently outperforms state-of-the-art methods on both base and novel classes of the COCO dataset while simultaneously being more stable than existing methods. The source code is available at: https://github.com/minhquanlecs/MaskDiff.
Abstract（参考訳）: 少数ショットのインスタンスセグメンテーション少数ショットの学習パラダイムをインスタンスセグメンテーションタスクに拡張する。これは、新しいカテゴリの注釈付き例でクエリイメージからインスタンスオブジェクトをセグメンテーションしようとするものである。従来のアプローチでは、ポイント推定と呼ばれるプロトタイプ学習を通じてその課題に対処しようと試みてきた。しかし、このメカニズムは予測のプロトタイプ(平均$K-$shot)に依存するため、パフォーマンスが不安定になる。点推定機構の欠点を克服するため、オブジェクト領域と$K-$shot情報に条件付けされたバイナリマスクの条件分布をモデル化したMaskDiffと呼ばれる新しい手法を提案する。ガウス雑音による摂動データを低密度領域に分散させる拡張手法に着想を得て,拡散確率モデルを用いてマスク分布をモデル化する。また,二項マスク生成プロセスにカテゴリ情報を統合するために,分類器のないガイドマスクサンプリングを提案する。提案手法は,既存の手法よりも安定しながら,cocoデータセットのベースクラスと新規クラスの両方において,最先端のメソッドを一貫して上回っています。ソースコードはhttps://github.com/minhquanlecs/maskdiff。

関連論文リスト

Accelerated Sampling from Masked Diffusion Models via Entropy Bounded Unmasking [17.511240770486452]
仮面拡散モデル (MDM) は, 言語モデリングにおける自己回帰モデル (ARM) と比較して, 競合性能を示した。本稿では,Entropy bounded unmasking 手法を用いて,既存のサンプルのドロップイン置換であるEB-Samplerを紹介する。 EB-Samplerは、パフォーマンスを損なうことなく、標準的なコーディングと数学推論ベンチマークで、最先端のMDMのサンプリングを約2～3倍高速化する。
論文参考訳（メタデータ） (2025-05-30T17:52:55Z)
Decoupling Classifier for Boosting Few-shot Object Detection and Instance Segmentation [33.738757197593564]
本稿では、いくつかのラベル付きインスタンスを持つ新しいクラスに迅速に適応するモデルを必要とする、FSOD( few-shot object detection)とFSIS( instance segmentation)に焦点を当てる。我々の分析は、ほとんどのFSODモデルやFSISモデルの標準分類ヘッドは、バイアス分類を緩和するために分離する必要があることを示唆している。このようにして、モデルはノイズ負のサンプルの効果を緩和しながら、新しいクラスを効果的に学習することができる。
論文参考訳（メタデータ） (2025-05-20T11:47:34Z)
[MASK] is All You Need [28.90875822599164]
離散状態モデルを用いてMasked Generative と Non-autoregressive Diffusion を接続する。離散状態モデルで[MASK]を活用することで、Masked Generative と Non-autoregressive Diffusion モデルを橋渡しできる。
論文参考訳（メタデータ） (2024-12-09T18:59:56Z)
Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文参考訳（メタデータ） (2024-10-09T15:02:28Z)
Hybrid diffusion models: combining supervised and generative pretraining for label-efficient fine-tuning of segmentation models [55.2480439325792]
そこで本研究では,第1領域における画像のデノベーションとマスク予測を同時に行うことを目的とした,新しいプレテキストタスクを提案する。提案手法を用いて事前学習したモデルを微調整すると、教師なしまたは教師なしの事前学習を用いて訓練した類似モデルの微調整よりも優れた結果が得られることを示す。
論文参考訳（メタデータ） (2024-08-06T20:19:06Z)
MaskUno: Switch-Split Block For Enhancing Instance Segmentation [0.0]
マスク予測を洗練されたROIを処理し、それらを分類し、特定のマスク予測者に割り当てるスイッチスプリットブロックに置き換えることを提案する。平均平均精度(mAP)が2.03%上昇し,80クラスにおいて高い成績を示した。
論文参考訳（メタデータ） (2024-07-31T10:12:14Z)
ProtoGMM: Multi-prototype Gaussian-Mixture-based Domain Adaptation Model for Semantic Segmentation [0.8213829427624407]
ドメイン適応型セマンティックセグメンテーションは、ラベルのないターゲットドメインに対して正確で高密度な予測を生成することを目的としている。本稿では,GMMを比較学習に組み込んだProtoGMMモデルを提案する。クラス間のセマンティックな類似性の向上,クラス間の類似性の低下,およびソースドメインとターゲットドメイン間のドメインアライメントを実現するために,マルチプロトタイプコントラスト学習を採用する。
論文参考訳（メタデータ） (2024-06-27T14:50:50Z)
SegRefiner: Towards Model-Agnostic Segmentation Refinement with Discrete Diffusion Process [102.18226145874007]
そこで我々は,異なるセグメンテーションモデルによって生成されるオブジェクトマスクの品質を高めるために,SegRefinerと呼ばれるモデルに依存しないソリューションを提案する。 SegRefinerは粗いマスクを入力として取り、離散拡散プロセスを用いてそれらを洗練する。さまざまな種類の粗いマスクにわたるセグメンテーションメトリックとバウンダリメトリックの両方を一貫して改善する。
論文参考訳（メタデータ） (2023-12-19T18:53:47Z)
Ref-Diff: Zero-shot Referring Image Segmentation with Generative Models [68.73086826874733]
本稿では,画像分割を参照するための新しい参照拡散分割器(Referring Diffusional segmentor, Ref-Diff)を提案する。提案生成器がなければ、生成モデルだけで既存のSOTAの弱教師付きモデルに匹敵する性能を達成できることを実証する。このことは、生成モデルがこのタスクに有益であり、より優れたセグメンテーションを参照するために識別モデルを補完できることを示している。
論文参考訳（メタデータ） (2023-08-31T14:55:30Z)
DFormer: Diffusion-guided Transformer for Universal Image Segmentation [86.73405604947459]
提案したDFormerは,拡散モデルを用いて画像分割タスクをデノナイズプロセスとみなしている。我々のDFormerは、ランダムに生成されたマスクの集合から、マスクとそれに対応するカテゴリを直接予測します。我々のDFormerは、最近の拡散型汎光学分割法Pix2Seq-Dより優れており、MS COCO val 2017セットで3.6%向上している。
論文参考訳（メタデータ） (2023-06-06T06:33:32Z)
Few-shot semantic segmentation via mask aggregation [5.886986014593717]
セマンティックセグメンテーションは、ラベル付きデータが少ない新しいクラスを認識することを目的としている。従来の研究では、これをピクセル単位の分類問題と見なしていた。この問題に対処するためのマスクベースの分類手法を提案する。
論文参考訳（メタデータ） (2022-02-15T07:13:09Z)
Meta Mask Correction for Nuclei Segmentation in Histopathological Image [5.36728433027615]
ノイズマスクを用いたデータを活用するメタラーニングに基づく新しい原子分割法を提案する。具体的には,ごく少量のクリーンなメタデータを用いてノイズマスクを修正可能な,従来のメタモデルの設計を行う。提案手法は, 最先端の結果が得られることを示す。
論文参考訳（メタデータ） (2021-11-24T13:53:35Z)
Attentional Prototype Inference for Few-Shot Segmentation [128.45753577331422]
数発のセグメンテーションのための確率的潜在変数フレームワークである注意型プロトタイプ推論(API)を提案する。我々は各オブジェクトカテゴリのプロトタイプを表現するためにグローバル潜在変数を定義し、確率分布としてモデル化する。我々は4つのベンチマークで広範な実験を行い、提案手法は最先端のプロトタイプベースの手法よりも、少なくとも競争力があり、しばしば優れた性能が得られる。
論文参考訳（メタデータ） (2021-05-14T06:58:44Z)
Mask-guided sample selection for Semi-Supervised Instance Segmentation [13.091166009687058]
半教師付きインスタンスセグメンテーションのためのアノテートするサンプルを決定するためのサンプル選択手法を提案する。本手法は, サンプルのラベル付きプールに対する擬似マスクの初回予測と, マスクの質を予測するスコアから構成される。品質スコアからアノテートしたほうがよいサンプルについて検討し, ランダム選択よりも優れた手法を示す。
論文参考訳（メタデータ） (2020-08-25T14:44:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。