論文の概要: Interactive Segmentation as Gaussian Process Classification
- arxiv url: http://arxiv.org/abs/2302.14578v1
- Date: Tue, 28 Feb 2023 14:01:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 16:25:41.992187
- Title: Interactive Segmentation as Gaussian Process Classification
- Title(参考訳): ガウス過程分類としての対話的セグメンテーション
- Authors: Minghao Zhou, Hong Wang, Qian Zhao, Yuexiang Li, Yawen Huang, Deyu
Meng, Yefeng Zheng
- Abstract要約: クリックベースのインタラクティブセグメンテーション(IS)は、ユーザインタラクション下で対象オブジェクトを抽出することを目的としている。
現在のディープラーニング(DL)ベースの手法のほとんどは、主にセマンティックセグメンテーションの一般的なパイプラインに従っている。
本稿では,各画像上でガウス過程(GP)に基づく画素単位のバイナリ分類モデルとしてISタスクを定式化することを提案する。
- 参考スコア(独自算出の注目度): 58.44673380545409
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Click-based interactive segmentation (IS) aims to extract the target objects
under user interaction. For this task, most of the current deep learning
(DL)-based methods mainly follow the general pipelines of semantic
segmentation. Albeit achieving promising performance, they do not fully and
explicitly utilize and propagate the click information, inevitably leading to
unsatisfactory segmentation results, even at clicked points. Against this
issue, in this paper, we propose to formulate the IS task as a Gaussian process
(GP)-based pixel-wise binary classification model on each image. To solve this
model, we utilize amortized variational inference to approximate the
intractable GP posterior in a data-driven manner and then decouple the
approximated GP posterior into double space forms for efficient sampling with
linear complexity. Then, we correspondingly construct a GP classification
framework, named GPCIS, which is integrated with the deep kernel learning
mechanism for more flexibility. The main specificities of the proposed GPCIS
lie in: 1) Under the explicit guidance of the derived GP posterior, the
information contained in clicks can be finely propagated to the entire image
and then boost the segmentation; 2) The accuracy of predictions at clicks has
good theoretical support. These merits of GPCIS as well as its good generality
and high efficiency are substantiated by comprehensive experiments on several
benchmarks, as compared with representative methods both quantitatively and
qualitatively.
- Abstract(参考訳): クリックベースのインタラクティブセグメンテーション(is)は、ユーザインタラクション下でターゲットオブジェクトを抽出することを目的としている。
このタスクでは、現在のディープラーニング(DL)ベースの手法のほとんどは、主にセマンティックセグメンテーションの一般的なパイプラインに従っている。
有望なパフォーマンスを達成する一方で、クリック情報の完全かつ明示的な利用や伝播は行わず、クリックポイントにおいても、必然的に不満足なセグメンテーション結果につながる。
本稿では,各画像上のガウス過程(GP)に基づく画素単位のバイナリ分類モデルとしてISタスクを定式化することを提案する。
そこで本モデルでは,データ駆動方式で計算可能なgp後続部を近似し,近似したgp後続部を二重空間形式に分離し,線形複雑化を伴う効率的なサンプリングを行う。
そこで,我々はGP分類フレームワークであるGPCISを構築し,より柔軟性を高めるために深層カーネル学習機構と統合する。
提案されたGPCISの主な特異性は次のとおりである。
1) 導出GP後部の明示的な指示の下で,クリックに含まれる情報は,画像全体に対して微妙に伝播し,セグメンテーションを増強することができる。
2) クリック時の予測精度は理論的に良好である。
GPCISのこれらの利点は、その優れた一般性と高い効率性は、いくつかのベンチマークでの包括的な実験によって、定量的かつ定性的に代表的手法と比較される。
関連論文リスト
- Resolution-Aware Design of Atrous Rates for Semantic Segmentation
Networks [7.58745191859815]
DeepLabはセマンティックセグメンテーションに広く使用されているディープニューラルネットワークであり、その成功は、アトラス空間ピラミッドプール(ASPP)と呼ばれる並列アーキテクチャによるものである。
アラスレートの固定値は、視野のサイズを制限するASPPモジュールに使用される。
本研究は,最適アラスレートを得るための実践的ガイドラインを提案する。
論文 参考訳(メタデータ) (2023-07-26T13:11:48Z) - FCN-Transformer Feature Fusion for Polyp Segmentation [12.62213319797323]
大腸内視鏡は大腸癌の早期発見のための金標準法として広く認められている。
大腸内視鏡画像におけるポリープのマニュアルセグメンテーションは時間を要する。
ポリプセグメンテーションの自動化におけるディープラーニングの利用が重要になっている。
論文 参考訳(メタデータ) (2022-08-17T15:31:06Z) - Inducing Gaussian Process Networks [80.40892394020797]
本稿では,特徴空間と誘導点を同時に学習するシンプルなフレームワークであるGaussian Process Network (IGN)を提案する。
特に誘導点は特徴空間で直接学習され、複雑な構造化領域のシームレスな表現を可能にする。
実世界のデータセットに対する実験結果から,IGNは最先端の手法よりも大幅に進歩していることを示す。
論文 参考訳(メタデータ) (2022-04-21T05:27:09Z) - Incremental Ensemble Gaussian Processes [53.3291389385672]
本稿では,EGPメタラーナーがGP学習者のインクリメンタルアンサンブル(IE-) GPフレームワークを提案し,それぞれが所定のカーネル辞書に属するユニークなカーネルを持つ。
各GP専門家は、ランダムな特徴ベースの近似を利用してオンライン予測とモデル更新を行い、そのスケーラビリティを生かし、EGPメタラーナーはデータ適応重みを生かし、熟練者ごとの予測を合成する。
新たなIE-GPは、EGPメタラーナーおよび各GP学習者内における構造化力学をモデル化することにより、時間変化関数に対応するように一般化される。
論文 参考訳(メタデータ) (2021-10-13T15:11:25Z) - Conditional Deep Gaussian Processes: empirical Bayes hyperdata learning [6.599344783327054]
本稿では,階層構成における中間GPをハイパーデータでサポートする条件付きDeep Gaussian Process (DGP)を提案する。
潜時空間における高密度ハイパーデータ限界における深層カーネル学習の等価性を示す。
予備補間の結果は,提案モデルがGPカーネル構成,DGP変分推論,深層カーネル学習と比較して表現力を示す。
論文 参考訳(メタデータ) (2021-10-01T17:50:48Z) - Boosting Few-shot Semantic Segmentation with Transformers [81.43459055197435]
TRansformer-based Few-shot Semantic segmentation Method (TRFS)
我々のモデルは,グローバル・エンハンスメント・モジュール(GEM)とローカル・エンハンスメント・モジュール(LEM)の2つのモジュールから構成される。
論文 参考訳(メタデータ) (2021-08-04T20:09:21Z) - Deep Gaussian Processes for Few-Shot Segmentation [66.08463078545306]
少数ショットのセグメンテーションは難しい作業であり、いくつかの注釈付きサンプルから一般化可能な表現を抽出する必要がある。
ガウス過程(GP)回帰に基づく数ショット学習者定式化を提案する。
PASCAL-5i と COCO-20i では mIoU スコアが68.1 と 49.8 である。
論文 参考訳(メタデータ) (2021-03-30T17:56:32Z) - GP-Tree: A Gaussian Process Classifier for Few-Shot Incremental Learning [23.83961717568121]
GP-Treeはガウス過程と深層カーネル学習を用いた多クラス分類の新しい手法である。
木に基づく階層モデルを構築し,各内部ノードがデータにGPを適合させる。
我々の手法は、クラス数とデータサイズの両方でうまくスケールする。
論文 参考訳(メタデータ) (2021-02-15T22:16:27Z) - Inter-domain Deep Gaussian Processes [45.28237107466283]
ドメイン間および深いガウス過程(DGP)の利点を組み合わせたドメイン間浅層GPの拡張を提案する。
提案手法は,DGPのドメイン間特徴量を用いて,既存の近似推論手法を用いて,シンプルでスケーラブルな近似推論を実現する方法を示す。
論文 参考訳(メタデータ) (2020-11-01T04:03:35Z) - Boundary-assisted Region Proposal Networks for Nucleus Segmentation [89.69059532088129]
大量の核が混在しているため、機械学習モデルはうまく機能しない。
我々は、堅牢なインスタンスレベルの核分割を実現する境界支援領域提案ネットワーク(BRP-Net)を考案する。
論文 参考訳(メタデータ) (2020-06-04T08:26:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。