論文の概要: Data Adaptive Few-shot Multi Label Segmentation with Foundation Model
- arxiv url: http://arxiv.org/abs/2410.09759v1
- Date: Sun, 13 Oct 2024 07:29:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-30 05:02:48.432673
- Title: Data Adaptive Few-shot Multi Label Segmentation with Foundation Model
- Title(参考訳): 基礎モデルを用いたデータ適応型Few-shot Multi Label Segmentation
- Authors: Gurunath Reddy, Dattesh Shanbhag, Deepa Anand,
- Abstract要約: 数発のセグメンテーションのための最先端の手法は、医療画像の準最適性能に悩まされている。
単一ラベル,多ラベルローカライゼーション,セグメンテーションのための基礎モデル (FM) ベースのアダプタを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The high cost of obtaining accurate annotations for image segmentation and localization makes the use of one and few shot algorithms attractive. Several state-of-the-art methods for few-shot segmentation have emerged, including text-based prompting for the task but suffer from sub-optimal performance for medical images. Leveraging sub-pixel level features of existing Vision Transformer (ViT) based foundation models for identifying similar region of interest (RoI) based on a single template image have been shown to be very effective for one shot segmentation and localization in medical images across modalities. However, such methods rely on assumption that template image and test image are well matched and simple correlation is sufficient to obtain correspondences. In practice, however such an approach can fail to generalize in clinical data due to patient pose changes, inter-protocol variations even within a single modality or extend to 3D data using single template image. Moreover, for multi-label tasks, the RoI identification has to be performed sequentially. In this work, we propose foundation model (FM) based adapters for single label, multi-label localization and segmentation to address these concerns. We demonstrate the efficacy of the proposed method for multiple segmentation and localization tasks for both 2D and 3D data as we well as clinical data with different poses and evaluate against the state of the art few shot segmentation methods.
- Abstract(参考訳): 画像のセグメンテーションとローカライゼーションのための正確なアノテーションを得るための高コストは、ショットアルゴリズムを1つと少数使うことを魅力的にしている。
数発のセグメンテーションのための最先端の手法がいくつか現れており、テキストベースのプロンプトを含むが、医療画像の準最適性能に悩まされている。
単一のテンプレート画像に基づく類似の関心領域(RoI)を同定するためのViTベースの基盤モデルを用いたサブピクセルレベルの特徴の活用は、一ショットのセグメンテーションや、モダリティをまたいだ医用画像の局所化に非常に有効であることが示されている。
しかし、このような手法はテンプレート画像とテスト画像がよく一致し、単純な相関で対応が得られるという仮定に依存している。
しかし、実際には、患者のポーズの変化による臨床データ、単一のモダリティ内であってもプロトコール間の変化、あるいは単一のテンプレート画像を用いた3Dデータへの拡張により、そのようなアプローチは、臨床データの一般化に失敗する可能性がある。
さらに、マルチラベルタスクでは、RoI識別を逐次行う必要がある。
本研究では, 単一ラベルのための基礎モデル (FM) ベースのアダプタ, マルチラベルのローカライゼーション, セグメンテーションを提案し, これらの問題に対処する。
提案手法の有効性を2次元および3次元データおよび異なるポーズを持つ臨床データに対して示すとともに,最先端のショットセグメンテーション法に対して評価する。
関連論文リスト
- Retrieval-augmented Few-shot Medical Image Segmentation with Foundation Models [17.461510586128874]
本稿では,DINOv2 と Segment Anything Model 2 を併用して,画像の検索を行う手法を提案する。
我々のアプローチでは、DINOv2の機能をクエリとして使用し、制限付きアノテートデータから類似したサンプルを検索し、それをメモリバンクにエンコードする。
論文 参考訳(メタデータ) (2024-08-16T15:48:07Z) - Correlation Weighted Prototype-based Self-Supervised One-Shot Segmentation of Medical Images [12.365801596593936]
医用画像セグメンテーションは、十分な注釈付きデータが入手できない領域の1つである。
スーパーピクセルから生成された擬似ラベルを用いた,プロトタイプベースのワンショット学習フレームワークを提案する。
提案手法は,最先端の手法と同等に機能することを示す。
論文 参考訳(メタデータ) (2024-08-12T15:38:51Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Promise:Prompt-driven 3D Medical Image Segmentation Using Pretrained
Image Foundation Models [13.08275555017179]
単点プロンプトのみを用いたプロンプト駆動型3次元医用画像分割モデルProMISeを提案する。
今回,大腸癌と膵腫瘍の2つの領域に分布する2つのパブリックデータセットについて検討した。
論文 参考訳(メタデータ) (2023-10-30T16:49:03Z) - A Simple and Robust Framework for Cross-Modality Medical Image
Segmentation applied to Vision Transformers [0.0]
単一条件モデルを用いて複数モードの公平な画像分割を実現するための簡単なフレームワークを提案する。
本研究の枠組みは,マルチモーダル全心条件課題において,他のモダリティセグメンテーション手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-09T09:51:44Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Unsupervised Domain Adaptation with Contrastive Learning for OCT
Segmentation [49.59567529191423]
本稿では,新しい未ラベル領域からのボリューム画像のセグメンテーションのための,新しい半教師付き学習フレームワークを提案する。
教師付き学習とコントラスト学習を併用し、3次元の近傍スライス間の類似性を利用したコントラストペア方式を導入する。
論文 参考訳(メタデータ) (2022-03-07T19:02:26Z) - Generalizable Cross-modality Medical Image Segmentation via Style
Augmentation and Dual Normalization [29.470385509955687]
本稿では,拡張されたソース類似画像とソース類似画像を利用する新しいデュアル正規化モジュールを提案する。
我々の手法は、他の最先端の領域一般化手法よりも優れている。
論文 参考訳(メタデータ) (2021-12-21T13:18:46Z) - Automatic size and pose homogenization with spatial transformer network
to improve and accelerate pediatric segmentation [51.916106055115755]
空間変換器ネットワーク(STN)を利用することにより、ポーズとスケール不変の新たなCNNアーキテクチャを提案する。
私たちのアーキテクチャは、トレーニング中に一緒に見積もられる3つのシーケンシャルモジュールで構成されています。
腹部CTスキャナーを用いた腎および腎腫瘍の分節法について検討した。
論文 参考訳(メタデータ) (2021-07-06T14:50:03Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - SCNet: Enhancing Few-Shot Semantic Segmentation by Self-Contrastive
Background Prototypes [56.387647750094466]
Few-shot セマンティックセマンティックセマンティクスは,クエリイメージ内の新規クラスオブジェクトを,アノテーション付きの例で分割することを目的としている。
先進的なソリューションのほとんどは、各ピクセルを学習した前景のプロトタイプに合わせることでセグメンテーションを行うメトリクス学習フレームワークを利用している。
このフレームワークは、前景プロトタイプのみとのサンプルペアの不完全な構築のために偏った分類に苦しんでいます。
論文 参考訳(メタデータ) (2021-04-19T11:21:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。