論文の概要: Learning Shape Priors by Pairwise Comparison for Robust Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2204.11090v1
- Date: Sat, 23 Apr 2022 15:29:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-26 14:22:32.974253
- Title: Learning Shape Priors by Pairwise Comparison for Robust Semantic
Segmentation
- Title(参考訳): ロバストなセマンティックセグメンテーションのためのペアワイズ比較による学習形状優先
- Authors: Cong Xie, Hualuo Liu, Shilei Cao, Dong Wei, Kai Ma, Liansheng Wang,
Yefeng Zheng
- Abstract要約: 一つのフレームワーク内で両方のタイプの事前をモデル化する新しいDLモデルを提案する。
類似性に基づくアテンションモジュールが提案され,両エンコーダからの情報を融合する。
2つの公開データセットの実験により,提案手法は競合する手法よりも優れた性能が得られることを示した。
- 参考スコア(独自算出の注目度): 31.255056209854033
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Semantic segmentation is important in medical image analysis. Inspired by the
strong ability of traditional image analysis techniques in capturing shape
priors and inter-subject similarity, many deep learning (DL) models have been
recently proposed to exploit such prior information and achieved robust
performance. However, these two types of important prior information are
usually studied separately in existing models. In this paper, we propose a
novel DL model to model both type of priors within a single framework.
Specifically, we introduce an extra encoder into the classic encoder-decoder
structure to form a Siamese structure for the encoders, where one of them takes
a target image as input (the image-encoder), and the other concatenates a
template image and its foreground regions as input (the template-encoder). The
template-encoder encodes the shape priors and appearance characteristics of
each foreground class in the template image. A cosine similarity based
attention module is proposed to fuse the information from both encoders, to
utilize both types of prior information encoded by the template-encoder and
model the inter-subject similarity for each foreground class. Extensive
experiments on two public datasets demonstrate that our proposed method can
produce superior performance to competing methods.
- Abstract(参考訳): 医用画像解析ではセマンティックセグメンテーションが重要である。
近年,従来の画像解析技術による形状前処理やオブジェクト間類似性の強い能力に触発されて,このような先行情報を活用するために多くのディープラーニング(DL)モデルが提案されている。
しかしながら、これらの2つの重要な事前情報は通常、既存のモデルで別々に研究される。
本稿では,1つのフレームワーク内での事前の両タイプをモデル化する新しいDLモデルを提案する。
具体的には、従来のエンコーダ-デコーダ構造に余分なエンコーダを導入し、エンコーダのシームス構造を作り、一方がターゲットイメージを入力として(画像エンコーダ)、他方がテンプレート画像とその前景領域を入力として(テンプレートエンコーダ)結合する。
テンプレートエンコーダは、テンプレート画像内の各前景クラスの形状先行および出現特性を符号化する。
両エンコーダからの情報を融合し,テンプレートエンコーダによって符号化された事前情報と,各前景クラスのオブジェクト間類似度をモデル化するために,コサイン類似度に基づくアテンションモジュールを提案する。
2つの公開データセットに関する広範囲な実験により,提案手法が競合する手法よりも優れた性能をもたらすことを実証した。
関連論文リスト
- Generating Multi-Image Synthetic Data for Text-to-Image Customization [48.59231755159313]
テキスト・ツー・イメージ・モデルのカスタマイズにより、ユーザーはカスタムのコンセプトを挿入し、目に見えない設定でコンセプトを生成することができる。
既存の方法は、コストのかかるテストタイム最適化か、マルチイメージの監督なしにシングルイメージのトレーニングデータセットのトレーニングエンコーダに依存している。
両制約に対処する簡単なアプローチを提案する。
論文 参考訳(メタデータ) (2025-02-03T18:59:41Z) - Correlation Weighted Prototype-based Self-Supervised One-Shot Segmentation of Medical Images [12.365801596593936]
医用画像セグメンテーションは、十分な注釈付きデータが入手できない領域の1つである。
スーパーピクセルから生成された擬似ラベルを用いた,プロトタイプベースのワンショット学習フレームワークを提案する。
提案手法は,最先端の手法と同等に機能することを示す。
論文 参考訳(メタデータ) (2024-08-12T15:38:51Z) - Few-Shot Medical Image Segmentation with High-Fidelity Prototypes [38.073371773707514]
本稿では,オブジェクトフォアグラウンドと背景を包括的に表現する高忠実度プロトタイプを構築するための,DSPNet(Detail Self-Refined Prototype Network)を提案する。
得られた詳細セマンティクスを維持しつつグローバルなセマンティクスを構築するために,マルチモーダル構造をクラスタリングでモデル化し,それぞれをチャネル的に融合させることにより,前景のプロトタイプを学習する。
論文 参考訳(メタデータ) (2024-06-26T05:06:14Z) - Domain Bridge: Generative model-based domain forensic for black-box
models [20.84645356097581]
我々は、一般的なデータドメインだけでなく、その特定の属性も決定する拡張されたアプローチを導入する。
本手法では,エンコーダに画像埋め込みモデル,デコーダに生成モデルを用いる。
我々のアプローチの重要な強みは、生成モデルである安定拡散をトレーニングする拡張データセットであるLAION-5Bを活用することである。
論文 参考訳(メタデータ) (2024-02-07T07:57:43Z) - With a Little Help from your own Past: Prototypical Memory Networks for
Image Captioning [47.96387857237473]
我々は、他のトレーニングサンプルを処理しながら得られたアクティベーションに注意を向けるネットワークを考案した。
私たちのメモリは、プロトタイプベクトルの定義を通じて過去のキーと値の分布をモデル化します。
本研究では,エンコーダ・デコーダ変換器の性能を3.7 CIDErポイント向上できることを示す。
論文 参考訳(メタデータ) (2023-08-23T18:53:00Z) - Unicom: Universal and Compact Representation Learning for Image
Retrieval [65.96296089560421]
大規模LAION400Mを,CLIPモデルにより抽出された共同テキストと視覚的特徴に基づいて,100万の擬似クラスにクラスタリングする。
このような矛盾を緩和するために、我々は、マージンベースのソフトマックス損失を構築するために、ランダムにクラス間の部分的なプロトタイプを選択する。
提案手法は,複数のベンチマークにおいて,教師なし,教師なしの画像検索手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-12T14:25:52Z) - Share With Thy Neighbors: Single-View Reconstruction by Cross-Instance
Consistency [59.427074701985795]
単一ビューの再構築は通常、視点アノテーション、シルエット、背景の欠如、同じインスタンスの複数のビュー、テンプレートの形状、対称性に依存する。
異なるオブジェクトインスタンスのイメージ間の一貫性を明確に活用することで、これらの監督と仮説をすべて回避します。
i)プログレッシブ・コンディショニング(プログレッシブ・コンディショニング)、(ii)類似の形状やテクスチャを持つインスタンス間の一貫性の喪失、(ii)モデルのカテゴリからインスタンスへと徐々に専門化するためのトレーニング戦略。
論文 参考訳(メタデータ) (2022-04-21T17:47:35Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Semantically Meaningful Class Prototype Learning for One-Shot Image
Semantic Segmentation [58.96902899546075]
ワンショットセマンティックイメージセグメンテーションは、1つの注釈付きイメージで新しいクラスのオブジェクト領域を分割することを目的としている。
最近の研究では、テスト時に予想される状況を模倣するために、エピソディクストレーニング戦略を採用している。
エピソードトレーニングにおいて,マルチクラスラベル情報を活用することを提案する。
ネットワークが各カテゴリに対してより意味のある機能を生成するように促すだろう。
論文 参考訳(メタデータ) (2021-02-22T12:07:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。