論文の概要: DiffAtlas: GenAI-fying Atlas Segmentation via Image-Mask Diffusion
- arxiv url: http://arxiv.org/abs/2503.06748v1
- Date: Sun, 09 Mar 2025 20:06:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:48:30.721379
- Title: DiffAtlas: GenAI-fying Atlas Segmentation via Image-Mask Diffusion
- Title(参考訳): DiffAtlas: Image-Mask DiffusionによるGenAIフィーリングのアトラスセグメンテーション
- Authors: Hantao Zhang, Yuhe Liu, Jiancheng Yang, Weidong Guo, Xinyuan Wang, Pascal Fua,
- Abstract要約: DiffAtlasは、トレーニング中の拡散を通じて画像とマスクの両方をモデル化する新しい生成フレームワークである。
テスト中、モデルはガイドされ、特定のターゲット画像マスク対を生成し、そこから対応するマスクを得る。
提案手法は既存の手法,特に限定データとゼロショットのモダリティのセグメンテーションにおいて優れる。
- 参考スコア(独自算出の注目度): 47.43502676919903
- License:
- Abstract: Accurate medical image segmentation is crucial for precise anatomical delineation. Deep learning models like U-Net have shown great success but depend heavily on large datasets and struggle with domain shifts, complex structures, and limited training samples. Recent studies have explored diffusion models for segmentation by iteratively refining masks. However, these methods still retain the conventional image-to-mask mapping, making them highly sensitive to input data, which hampers stability and generalization. In contrast, we introduce DiffAtlas, a novel generative framework that models both images and masks through diffusion during training, effectively ``GenAI-fying'' atlas-based segmentation. During testing, the model is guided to generate a specific target image-mask pair, from which the corresponding mask is obtained. DiffAtlas retains the robustness of the atlas paradigm while overcoming its scalability and domain-specific limitations. Extensive experiments on CT and MRI across same-domain, cross-modality, varying-domain, and different data-scale settings using the MMWHS and TotalSegmentator datasets demonstrate that our approach outperforms existing methods, particularly in limited-data and zero-shot modality segmentation. Code is available at https://github.com/M3DV/DiffAtlas.
- Abstract(参考訳): 正確な医用画像分割は解剖学的デライン化に不可欠である。
U-Netのようなディープラーニングモデルは大きな成功を収めているが、大きなデータセットとドメインシフト、複雑な構造、限られたトレーニングサンプルに大きく依存している。
最近の研究は、繰り返し精製マスクによるセグメンテーションの拡散モデルについて検討している。
しかし、これらの手法は従来の画像とマスクのマッピングを維持しており、入力データに非常に敏感であり、安定性と一般化を損なう。
対照的に、DiffAtlasは、訓練中の拡散を通して画像とマスクの両方をモデル化する新しい生成フレームワークであり、事実上「GenAI-fying」アトラスに基づくセグメンテーションである。
テスト中、モデルはガイドされ、特定のターゲット画像マスク対を生成し、そこから対応するマスクを得る。
DiffAtlasは、スケーラビリティとドメイン固有の制限を克服しながら、atlasパラダイムの堅牢性を維持している。
MMWHS と TotalSegmentator のデータセットを用いて,CT と MRI の同領域,クロスモダリティ,可変ドメイン,異なるデータスケール設定に対する広範な実験を行い,本手法が既存の手法,特に限定データとゼロショットのモダリティセグメンテーションよりも優れていることを示した。
コードはhttps://github.com/M3DV/DiffAtlas.comで入手できる。
関連論文リスト
- Unsupervised Modality Adaptation with Text-to-Image Diffusion Models for Semantic Segmentation [54.96563068182733]
セグメンテーションタスクのためのテキスト・ツー・イメージ拡散モデル(MADM)を用いたモダリティ適応を提案する。
MADMは、広範囲な画像とテキストのペアで事前訓練されたテキストと画像の拡散モデルを使用して、モデルの相互モダリティ能力を向上する。
我々は,MADMが画像から深度,赤外線,イベントのモダリティといった様々なモダリティタスクにまたがって,最先端の適応性能を実現することを示す。
論文 参考訳(メタデータ) (2024-10-29T03:49:40Z) - HiDiff: Hybrid Diffusion Framework for Medical Image Segmentation [16.906987804797975]
HiDiffは医療画像セグメンテーションのためのハイブリッド拡散フレームワークである。
既存の識別的セグメンテーションモデルと新しい生成的拡散モデルの強みを相乗化することができる。
小さなオブジェクトをセグメンテーションし、新しいデータセットに一般化する。
論文 参考訳(メタデータ) (2024-07-03T23:59:09Z) - Pathological Primitive Segmentation Based on Visual Foundation Model with Zero-Shot Mask Generation [3.5177988631063486]
本稿では,SAMの学習済み自然画像エンコーダを検出ベース領域提案に適用する手法を提案する。
SAMというベースフレームワーク全体は、追加のトレーニングや微調整を必要としないが、病理学における2つの基本的なセグメンテーションタスクに対してエンドツーエンドの結果をもたらす可能性がある。
論文 参考訳(メタデータ) (2024-04-12T16:29:49Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - EmerDiff: Emerging Pixel-level Semantic Knowledge in Diffusion Models [52.3015009878545]
我々は、追加の訓練をすることなく、きめ細かなセグメンテーションマップを生成できる画像セグメンタを開発した。
低次元特徴写像の空間的位置と画像画素間の意味的対応を同定する。
大規模な実験では、生成したセグメンテーションマップがよく説明され、画像の細部を捉えることが示されている。
論文 参考訳(メタデータ) (2024-01-22T07:34:06Z) - DG-TTA: Out-of-domain medical image segmentation through Domain Generalization and Test-Time Adaptation [43.842694540544194]
本稿では、ドメインの一般化とテスト時間適応を組み合わせることで、未確認対象領域で事前学習したモデルを再利用するための非常に効果的なアプローチを提案する。
本手法は,事前訓練した全身CTモデルと組み合わせることで,MR画像を高精度に分割できることを実証する。
論文 参考訳(メタデータ) (2023-12-11T10:26:21Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Self-Supervised Generative Style Transfer for One-Shot Medical Image
Segmentation [10.634870214944055]
医用画像のセグメンテーションにおいて、教師付きディープネットワークの成功は、豊富なラベル付きデータを必要とするコストが伴う。
本稿では,ボリューム画像分割ペアを合成可能なデータ拡張のための,新しいボリューム自己教師型学習法を提案する。
我々の研究の中心的信条は、ワンショット生成学習と自己指導型学習戦略の併用による恩恵を受けている。
論文 参考訳(メタデータ) (2021-10-05T15:28:42Z) - Cross-Domain Segmentation with Adversarial Loss and Covariate Shift for
Biomedical Imaging [2.1204495827342438]
本論文は,異なるモダリティから異なるパターンと共有パターンをカプセル化することにより,ドメイン間データから堅牢な表現を学習できる新しいモデルの実現を目的とする。
正常な臨床試験で得られたCTおよびMRI肝データに対する試験は、提案したモデルが他のすべてのベースラインを大きなマージンで上回っていることを示している。
論文 参考訳(メタデータ) (2020-06-08T07:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。