論文の概要: LMS-Net: A Learned Mumford-Shah Network For Few-Shot Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2502.05473v1
- Date: Sat, 08 Feb 2025 07:15:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:32:16.896413
- Title: LMS-Net: A Learned Mumford-Shah Network For Few-Shot Medical Image Segmentation
- Title(参考訳): LMS-Net:Mumford-Shah Network for Few-Shot Medical Image Segmentation
- Authors: Shengdong Zhang, Fan Jia, Xiang Li, Hao Zhang, Jun Shi, Liyan Ma, Shihui Ying,
- Abstract要約: 我々はLearned Mumford-Shah Network(LMS-Net)と呼ばれる新しい深層展開ネットワークを提案する。
我々は,学習したMumford-Shahモデル(LMSモデル)を数学的基礎として活用し,洞察を統一されたフレームワークに統合する。
3つの医用セグメンテーションデータセットの総合的な実験により,本手法の有効性が検証された。
- 参考スコア(独自算出の注目度): 16.384916751377794
- License:
- Abstract: Few-shot semantic segmentation (FSS) methods have shown great promise in handling data-scarce scenarios, particularly in medical image segmentation tasks. However, most existing FSS architectures lack sufficient interpretability and fail to fully incorporate the underlying physical structures of semantic regions. To address these issues, in this paper, we propose a novel deep unfolding network, called the Learned Mumford-Shah Network (LMS-Net), for the FSS task. Specifically, motivated by the effectiveness of pixel-to-prototype comparison in prototypical FSS methods and the capability of deep priors to model complex spatial structures, we leverage our learned Mumford-Shah model (LMS model) as a mathematical foundation to integrate these insights into a unified framework. By reformulating the LMS model into prototype update and mask update tasks, we propose an alternating optimization algorithm to solve it efficiently. Further, the iterative steps of this algorithm are unfolded into corresponding network modules, resulting in LMS-Net with clear interpretability. Comprehensive experiments on three publicly available medical segmentation datasets verify the effectiveness of our method, demonstrating superior accuracy and robustness in handling complex structures and adapting to challenging segmentation scenarios. These results highlight the potential of LMS-Net to advance FSS in medical imaging applications. Our code will be available at: https://github.com/SDZhang01/LMSNet
- Abstract(参考訳): Few-shot semantic segmentation (FSS)メソッドは、特に医療画像のセグメンテーションタスクにおいて、データスカースシナリオの処理において大きな可能性を示している。
しかし、既存のFSSアーキテクチャのほとんどは、十分な解釈性がなく、セマンティック領域の基盤となる物理的構造を完全に組み込むことができなかった。
これらの課題に対処するため,本研究では,FSSタスクのためのLearted Mumford-Shah Network (LMS-Net) と呼ばれる,新しい深層展開ネットワークを提案する。
具体的には,FSS法における画素対プロトタイプ比較の有効性と,複雑な空間構造をモデル化するための深部事前の能力に動機付けられ,学習したマンフォード・シャーモデル(LMSモデル)を数学的基盤として活用し,これらの知見を統一的なフレームワークに統合する。
LMSモデルをプロトタイプ更新とマスク更新タスクに再構成することにより、効率よく解くための交互最適化アルゴリズムを提案する。
さらに、このアルゴリズムの反復的なステップは対応するネットワークモジュールに展開され、明確な解釈性を持つLMS-Netとなる。
3つの医用セグメンテーションデータセットの総合的な実験により,本手法の有効性が検証され,複雑な構造を扱う上での精度と堅牢性,難解なセグメンテーションシナリオへの適応性が示された。
これらの結果は、医用画像の分野でのFSSの進歩にLMS-Netの可能性を浮き彫りにした。
私たちのコードは、https://github.com/SDZhang01/LMSNetで利用可能です。
関連論文リスト
- Multimodality Helps Few-Shot 3D Point Cloud Semantic Segmentation [61.91492500828508]
FS-PCS (Few-shot 3D point cloud segmentation) は、最小のサポートサンプルで新しいカテゴリを分割するモデルを一般化することを目的としている。
本稿では,テキストラベルと潜在的に利用可能な2次元画像モダリティを利用して,コストフリーのマルチモーダルFS-PCSセットアップを提案する。
トレーニングバイアスを軽減するため,テスト時間適応型クロスモーダルセグ(TACC)技術を提案する。
論文 参考訳(メタデータ) (2024-10-29T19:28:41Z) - SocialGPT: Prompting LLMs for Social Relation Reasoning via Greedy Segment Optimization [70.11167263638562]
社会的関係推論は、友人、配偶者、同僚などの関係カテゴリを画像から識別することを目的としている。
まず、VFM(Vision Foundation Models)の知覚能力と、モジュラーフレームワーク内でのLLM(Large Language Models)の推論能力を組み合わせた、シンプルだが巧妙な名前のフレームワークを提示する。
論文 参考訳(メタデータ) (2024-10-28T18:10:26Z) - PROMPT-IML: Image Manipulation Localization with Pre-trained Foundation
Models Through Prompt Tuning [35.39822183728463]
本稿では,改ざん画像を検出するための新しいPrompt-IMLフレームワークを提案する。
人間は、意味情報と高周波情報に基づいて、画像の真偽を識別する傾向がある。
我々のモデルは8つの典型的なフェイク画像データセットでより良い性能を得ることができる。
論文 参考訳(メタデータ) (2024-01-01T03:45:07Z) - CMFDFormer: Transformer-based Copy-Move Forgery Detection with Continual
Learning [52.72888626663642]
コピーモーブ偽造検出は、疑わしい偽画像中の重複領域を検出することを目的としている。
深層学習に基づく複写偽造検出手法が最上位にある。
CMFDFormer という名称の Transformer-style copy-move forgery ネットワークを提案する。
また、CMFDFormerが新しいタスクを処理できるように、新しいPCSD連続学習フレームワークを提供する。
論文 参考訳(メタデータ) (2023-11-22T09:27:46Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Interpretable Small Training Set Image Segmentation Network Originated
from Multi-Grid Variational Model [5.283735137946097]
深層学習法 (DL) が提案され, 画像分割に広く利用されている。
DLメソッドは通常、トレーニングデータとして大量の手動セグメントデータを必要とし、解釈性に乏しい。
本稿では,MSモデルにおける手作り正則項をデータ適応型一般化可学習正則項に置き換える。
論文 参考訳(メタデータ) (2023-06-25T02:34:34Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - A Dual-branch Self-supervised Representation Learning Framework for
Tumour Segmentation in Whole Slide Images [12.961686610789416]
自己教師付き学習(SSL)は、スライドイメージ全体のアノテーションオーバーヘッドを低減する代替ソリューションとして登場した。
これらのSSLアプローチは、識別画像の特徴を学習する際の性能を制限するマルチレゾリューションWSIを扱うために設計されていない。
マルチ解像度WSIから画像特徴を効果的に学習できるDSF-WSI(Dual-branch SSL Framework for WSI tumour segmentation)を提案する。
論文 参考訳(メタデータ) (2023-03-20T10:57:28Z) - FAS-UNet: A Novel FAS-driven Unet to Learn Variational Image
Segmentation [3.741136641573471]
本稿では,そのモデルとアルゴリズムを利用してマルチスケールの特徴を抽出する新しい変動モデルインフォームドネットワーク(FAS-Unet)を提案する。
提案するネットワークは,画像データと数理モデルを統合し,いくつかの畳み込みカーネルを学習して実装する。
実験結果から,提案するFAS-Unetは,定性的,定量的,モデル複雑度評価において,他の最先端手法と非常に競合することが示された。
論文 参考訳(メタデータ) (2022-10-27T04:15:16Z) - Boosting Few-shot Semantic Segmentation with Transformers [81.43459055197435]
TRansformer-based Few-shot Semantic segmentation Method (TRFS)
我々のモデルは,グローバル・エンハンスメント・モジュール(GEM)とローカル・エンハンスメント・モジュール(LEM)の2つのモジュールから構成される。
論文 参考訳(メタデータ) (2021-08-04T20:09:21Z) - MSRF-Net: A Multi-Scale Residual Fusion Network for Biomedical Image
Segmentation [10.979393806308648]
医用画像分割タスクに特化して設計されたMSRF-Netという新しいアーキテクチャを提案する。
MSRF-Netは、デュアルスケール高密度核融合ブロック(DSDF)を用いて、様々な受容場のマルチスケール特徴を交換できる
我々のDSDFブロックは2つの異なる解像度スケールで情報交換が可能であり、MSRFサブネットワークは複数のDSDFブロックを順次使用してマルチスケール融合を行う。
論文 参考訳(メタデータ) (2021-05-16T15:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。