論文の概要: Probabilistic U-Net with Kendall Shape Spaces for Geometry-Aware Segmentations of Images
- arxiv url: http://arxiv.org/abs/2410.14017v1
- Date: Thu, 17 Oct 2024 20:32:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-21 14:24:29.457526
- Title: Probabilistic U-Net with Kendall Shape Spaces for Geometry-Aware Segmentations of Images
- Title(参考訳): 幾何学的画像分割のためのケンドール形状空間を持つ確率的U-Net
- Authors: Jiyoung Park, Günay Doğan,
- Abstract要約: セグメント化の幾何学を組み込んだ確率的画像分割モデルを提案する。
我々のモデルはまた、Kendall形状変化自動エンコーダ(citevadgama2023kendall)を採用して、Kendall形状空間をエンコードする。
- 参考スコア(独自算出の注目度): 0.3499042782396683
- License:
- Abstract: One of the fundamental problems in computer vision is image segmentation, the task of detecting distinct regions or objects in given images. Deep Neural Networks (DNN) have been shown to be very effective in segmenting challenging images, producing convincing segmentations. There is further need for probabilistic DNNs that can reflect the uncertainties from the input images and the models into the computed segmentations, in other words, new DNNs that can generate multiple plausible segmentations and their distributions depending on the input or the model uncertainties. While there are existing probabilistic segmentation models, many of them do not take into account the geometry or shape underlying the segmented regions. In this paper, we propose a probabilistic image segmentation model that can incorporate the geometry of a segmentation. Our proposed model builds on the Probabilistic U-Net of \cite{kohl2018probabilistic} to generate probabilistic segmentations, i.e.\! multiple likely segmentations for an input image. Our model also adopts the Kendall Shape Variational Auto-Encoder of \cite{vadgama2023kendall} to encode a Kendall shape space in the latent variable layers of the prior and posterior networks of the Probabilistic U-Net. Incorporating the shape space in this manner leads to a more robust segmentation with spatially coherent regions, respecting the underlying geometry in the input images.
- Abstract(参考訳): コンピュータビジョンにおける基本的な問題の1つは画像分割であり、与えられた画像内の異なる領域や物体を検出するタスクである。
ディープニューラルネットワーク(DNN)は、挑戦的なイメージのセグメンテーションに非常に効果的であることが示されている。
さらに、入力画像とモデルからの不確実性を計算されたセグメンテーションに反映できる確率的DNNが必要であり、言い換えれば、入力やモデルの不確実性に応じて複数の可算セグメンテーションとそれらの分布を生成することができる新しいDNNである。
既存の確率的セグメンテーションモデルはあるが、その多くが、セグメンテーション領域の下の幾何学や形状を考慮に入れていない。
本稿では,セグメンテーションの幾何学を組み込んだ確率論的画像セグメンテーションモデルを提案する。
提案モデルでは,確率的セグメンテーション(probabilistic segmentation)を生成するために,確率的U-Net of \cite{kohl2018probabilistic}に基づいて構築する。
我々のモデルはまた、確率的U-Netの前と後のネットワークの潜在変数層にKendall形状空間を符号化するために、 \cite{vadgama2023kendall} のKendall形状変分自動エンコーダも採用している。
この方法で形状空間を組み込むと、入力画像の基底となる幾何学を尊重し、空間的に整合した領域とのより堅牢なセグメンテーションが導かれる。
関連論文リスト
- View-Consistent Hierarchical 3D Segmentation Using Ultrametric Feature Fields [52.08335264414515]
我々は3次元シーンを表すニューラル・レージアンス・フィールド(NeRF)内の新しい特徴場を学習する。
本手法は、ビュー一貫性の多粒性2Dセグメンテーションを入力とし、3D一貫性のセグメンテーションの階層構造を出力として生成する。
提案手法と,多視点画像と多粒性セグメンテーションを用いた合成データセットのベースラインの評価を行い,精度と視点整合性を向上したことを示す。
論文 参考訳(メタデータ) (2024-05-30T04:14:58Z) - Variational multichannel multiclass segmentation using unsupervised
lifting with CNNs [0.0]
与えられた画像をK$の異なる領域に分割するフレキシブルなマルチクラスセグメンテーション手法を実装した。
画像の事前分解を目的とした畳み込みニューラルネットワーク(CNN)を用いる。
セグメンテーションの出発点となる情報的特徴写像の抽出に特に重点を置いている。
論文 参考訳(メタデータ) (2023-02-04T18:01:47Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - A singular Riemannian geometry approach to Deep Neural Networks II.
Reconstruction of 1-D equivalence classes [78.120734120667]
入力空間における出力多様体内の点の事前像を構築する。
我々は、n-次元実空間から(n-1)-次元実空間へのニューラルネットワークマップの場合の簡易性に焦点をあてる。
論文 参考訳(メタデータ) (2021-12-17T11:47:45Z) - Contour Proposal Networks for Biomedical Instance Segmentation [0.8602553195689513]
Contour Proposal Network (CPN) という,概念的に単純なオブジェクトインスタンスセグメンテーションフレームワークを提案する。
CPNは、Fourier Descriptorsに基づく解釈可能な固定サイズの表現を使用して、閉じたオブジェクトの輪郭を同時に取り付けながら、画像内のおそらく重複するオブジェクトを検出する。
U-Net や Mask R-CNN のセグメンテーション精度を上回った CPN と,リアルタイムアプリケーションに適した実行時間を持つ変種を示す。
論文 参考訳(メタデータ) (2021-04-07T21:00:45Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Stochastic Segmentation Networks: Modelling Spatially Correlated
Aleatoric Uncertainty [32.33791302617957]
画像セグメンテーションネットワークアーキテクチャを用いてアレータティック不確実性をモデル化するための効率的な確率的手法であるセグメンテーションネットワーク(SSN)を導入する。
SSNは単一の画像に対して複数の空間的コヒーレント仮説を生成することができる。
2次元CTでは肺結節,3次元MRIでは脳腫瘍を含む実世界の医療データのセグメンテーションについて検討した。
論文 参考訳(メタデータ) (2020-06-10T18:06:41Z) - CRNet: Cross-Reference Networks for Few-Shot Segmentation [59.85183776573642]
少ないショットセグメンテーションは、少数のトレーニングイメージを持つ新しいクラスに一般化できるセグメンテーションモデルを学ぶことを目的としている。
相互参照機構により、我々のネットワークは2つの画像に共起する物体をよりよく見つけることができる。
PASCAL VOC 2012データセットの実験は、我々のネットワークが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2020-03-24T04:55:43Z) - Deep Convolutional Neural Networks with Spatial Regularization, Volume
and Star-shape Priori for Image Segmentation [6.282154392910916]
CNNの既存のネットワークアーキテクチャにおける分類機能は単純であり、重要な空間情報を扱う能力に欠ける。
我々は,多くの空間的先行情報をDCNNに簡単に統合できる,新しいソフト・スレッショルド・ダイナミクス(STD)フレームワークを提案する。
提案手法は一般的な数学的枠組みであり,どの意味的セグメンテーションDCNNにも適用可能である。
論文 参考訳(メタデータ) (2020-02-10T18:03:44Z) - Evolution of Image Segmentation using Deep Convolutional Neural Network:
A Survey [0.0]
我々はCNNに基づくセマンティックとインスタンスセグメンテーションの両方の進化を垣間見る。
我々は、最先端のパン光学セグメンテーションモデルを垣間見せた。
論文 参考訳(メタデータ) (2020-01-13T06:07:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。