論文の概要: Unified and Semantically Grounded Domain Adaptation for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2508.08660v1
- Date: Tue, 12 Aug 2025 05:56:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 21:07:34.319898
- Title: Unified and Semantically Grounded Domain Adaptation for Medical Image Segmentation
- Title(参考訳): 医用画像分割のための統一的領域適応と意味的領域適応
- Authors: Xin Wang, Yin Guo, Jiamin Xia, Kaiyu Zhang, Niranjan Balu, Mahmud Mossa-Basha, Linda Shapiro, Chun Yuan,
- Abstract要約: 医用画像セグメンテーションのための以前の教師なし領域適応アプローチは、ソースアクセス可能な設定に合わせて狭義に調整されている。
我々は、ソースアクセシビリティとソースフリーアダプションの両方をサポートする統一的でセマンティックな基盤となるフレームワークを導入する。
当社のフレームワークは、ソースフリー性能がソースアクセシビリティに近づきながら、両方の設定で最先端の結果を達成する。
- 参考スコア(独自算出の注目度): 26.940252595979892
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most prior unsupervised domain adaptation approaches for medical image segmentation are narrowly tailored to either the source-accessible setting, where adaptation is guided by source-target alignment, or the source-free setting, which typically resorts to implicit supervision mechanisms such as pseudo-labeling and model distillation. This substantial divergence in methodological designs between the two settings reveals an inherent flaw: the lack of an explicit, structured construction of anatomical knowledge that naturally generalizes across domains and settings. To bridge this longstanding divide, we introduce a unified, semantically grounded framework that supports both source-accessible and source-free adaptation. Fundamentally distinct from all prior works, our framework's adaptability emerges naturally as a direct consequence of the model architecture, without the need for any handcrafted adaptation strategies. Specifically, our model learns a domain-agnostic probabilistic manifold as a global space of anatomical regularities, mirroring how humans establish visual understanding. Thus, the structural content in each image can be interpreted as a canonical anatomy retrieved from the manifold and a spatial transformation capturing individual-specific geometry. This disentangled, interpretable formulation enables semantically meaningful prediction with intrinsic adaptability. Extensive experiments on challenging cardiac and abdominal datasets show that our framework achieves state-of-the-art results in both settings, with source-free performance closely approaching its source-accessible counterpart, a level of consistency rarely observed in prior works. Beyond quantitative improvement, we demonstrate strong interpretability of the proposed framework via manifold traversal for smooth shape manipulation.
- Abstract(参考訳): 医用画像のセグメンテーションに対する以前の非教師なし領域適応アプローチは、ソース・ターゲットアライメントによって適応が誘導されるソース・アクセス可能な設定や、通常擬似ラベルやモデル蒸留のような暗黙的な監督機構を利用するソース・フリー設定に狭義に調整されている。
この2つの設定間の方法論的設計のかなりのばらつきは、ドメインや設定をまたいで自然に一般化する、明示的で構造化された解剖学的知識の構築の欠如という、固有の欠陥を明らかにしている。
この長期にわたる分割を橋渡しするために、ソースアクセシビリティとソースフリーアダプションの両方をサポートする統一的でセマンティックな基盤となるフレームワークを導入します。
基本的には以前のすべての作業と異なり、我々のフレームワークの適応性は、手作りの適応戦略を必要とせずに、モデルアーキテクチャの直接的な結果として自然に現れます。
具体的には、ドメインに依存しない確率多様体を解剖学的正規性のグローバル空間として学習し、人間の視覚的理解の確立を反映する。
したがって、各画像の構造内容は、多様体から取得した正準解剖学と、個別の幾何学を捉える空間変換と解釈することができる。
この非絡み合った解釈可能な定式化は、本質的な適応性を持つ意味的に意味のある予測を可能にする。
心的および腹部的データセットに対する大規模な実験により,我々のフレームワークは両設定とも最先端の結果が得られ,ソースフリー性能はソースアクセシブルに近づいた。
定量的改善の他に, 円滑な形状操作のための多様体トラバーサルによるフレームワークの強い解釈可能性を示す。
関連論文リスト
- Escaping Plato's Cave: JAM for Aligning Independently Trained Vision and Language Models [29.59537209390697]
単一モードモデルの潜在表現に対して、モダリティ固有のオートエンコーダを訓練するフレームワークを導入する。
類推により、このフレームワークはプラトンの洞窟から逃れる方法として機能し、結合しない入力から共有構造の出現を可能にする。
論文 参考訳(メタデータ) (2025-07-01T21:43:50Z) - Geometry-Editable and Appearance-Preserving Object Compositon [67.98806888489385]
汎用オブジェクト合成(GOC)は、対象オブジェクトを望まれる幾何学的性質を持つ背景シーンにシームレスに統合することを目的としている。
近年のアプローチは意味的埋め込みを導出し、それらを高度な拡散モデルに統合し、幾何学的に編集可能な生成を可能にする。
本稿では,まずセマンティックな埋め込みを活用して,所望の幾何学的変換を暗黙的にキャプチャするDistangled Geometry-editable and Outearance-Preserving Diffusionモデルを提案する。
論文 参考訳(メタデータ) (2025-05-27T09:05:28Z) - RemInD: Remembering Anatomical Variations for Interpretable Domain Adaptive Medical Image Segmentation [28.100574829137994]
医用画像セグメンテーションにおける非教師なし領域適応(UDA)のための新しいフレームワークであるRemInDを提案する。
RemInDは、いくつかのアンカーによって特徴づけられるドメインに依存しない潜在多様体を学び、解剖学的変異を記憶する。
RemInDは1つのアライメントアプローチを用いて最先端のパフォーマンスを実現し、既存手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-02-15T19:41:17Z) - Revisiting Adaptive Cellular Recognition Under Domain Shifts: A Contextual Correspondence View [49.03501451546763]
生物学的文脈における暗黙の対応の重要性を明らかにする。
モデル構成成分間のインスタンス認識トレードオフを確保するために, 自己適応型動的蒸留を提案する。
論文 参考訳(メタデータ) (2024-07-14T04:41:16Z) - Bayesian Unsupervised Disentanglement of Anatomy and Geometry for Deep Groupwise Image Registration [50.62725807357586]
本稿では,マルチモーダル群画像登録のための一般ベイズ学習フレームワークを提案する。
本稿では,潜在変数の推論手順を実現するために,新しい階層的変分自動符号化アーキテクチャを提案する。
心臓、脳、腹部の医療画像から4つの異なるデータセットを含む,提案された枠組みを検証する実験を行った。
論文 参考訳(メタデータ) (2024-01-04T08:46:39Z) - Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。
本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。
本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。