論文の概要: Spatial-aware Symmetric Alignment for Text-guided Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2512.22981v1
- Date: Sun, 28 Dec 2025 16:02:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.310384
- Title: Spatial-aware Symmetric Alignment for Text-guided Medical Image Segmentation
- Title(参考訳): テキスト誘導型医用画像分割のための空間認識対称アライメント
- Authors: Linglin Liao, Qichuan Geng, Yu Liu,
- Abstract要約: テキスト誘導医療画像は、医用画像のセグメンテーションをかなり約束している。
本研究では,ハイブリッド医療用テキストを参照する能力を高めるため,空間認識型対称アライメント(SSA)フレームワークを提案する。
SSAは、特に空間的制約によって特徴づけられる病変を正確に分断する際に、最先端のSOTA(State-of-the-art)性能を達成する。
- 参考スコア(独自算出の注目度): 7.514759533994352
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-guided Medical Image Segmentation has shown considerable promise for medical image segmentation, with rich clinical text serving as an effective supplement for scarce data. However, current methods have two key bottlenecks. On one hand, they struggle to process diagnostic and descriptive texts simultaneously, making it difficult to identify lesions and establish associations with image regions. On the other hand, existing approaches focus on lesions description and fail to capture positional constraints, leading to critical deviations. Specifically, with the text "in the left lower lung", the segmentation results may incorrectly cover both sides of the lung. To address the limitations, we propose the Spatial-aware Symmetric Alignment (SSA) framework to enhance the capacity of referring hybrid medical texts consisting of locational, descriptive, and diagnostic information. Specifically, we propose symmetric optimal transport alignment mechanism to strengthen the associations between image regions and multiple relevant expressions, which establishes bi-directional fine-grained multimodal correspondences. In addition, we devise a composite directional guidance strategy that explicitly introduces spatial constraints in the text by constructing region-level guidance masks. Extensive experiments on public benchmarks demonstrate that SSA achieves state-of-the-art (SOTA) performance, particularly in accurately segmenting lesions characterized by spatial relational constraints.
- Abstract(参考訳): テキスト誘導型医用画像セグメンテーションは, 医用画像セグメンテーションに極めて有望であり, リッチな臨床用テキストは, 少ないデータに対する効果的な補足として有効である。
しかし、現在の手法には2つの重要なボトルネックがある。
一方,診断テキストと記述テキストを同時に処理することは困難であり,病変の同定や画像領域との関連性の確立が困難である。
一方、既存のアプローチでは病変の記述に重点を置いており、位置制約を捉えていないため、重大なずれが生じている。
特に「左下肺」のテキストでは、セグメント化の結果が肺の両側を誤って覆っている可能性がある。
この制約に対処するために、位置、記述、診断情報からなるハイブリッド医療テキストを参照する能力を高めるために、空間認識対称アライメント(SSA)フレームワークを提案する。
具体的には、画像領域と複数の関連表現の関連性を強化するための対称的最適輸送アライメント機構を提案し、双方向の微細なマルチモーダル対応を確立する。
さらに、地域レベルの誘導マスクを構築することで、テキストに空間的制約を明示的に導入する複合指向性誘導戦略を考案する。
公開ベンチマークによる大規模な実験により、SSAは、特に空間的関係制約によって特徴づけられる損傷を正確にセグメント化する際に、最先端のSOTA(State-of-the-art)性能を達成することが示された。
関連論文リスト
- TGC-Net: A Structure-Aware and Semantically-Aligned Framework for Text-Guided Medical Image Segmentation [56.09179939570486]
本稿では,パラメータ効率,タスク固有適応に着目したCLIPベースのフレームワークであるTGC-Netを提案する。
TGC-Netは、挑戦的なベンチマークで顕著なDiceゲインを含む、トレーニング可能なパラメータをかなり少なくして、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-24T12:06:26Z) - Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.350584471060756]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。
本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。
SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文 参考訳(メタデータ) (2025-09-30T08:59:06Z) - Progressive Local Alignment for Medical Multimodal Pre-training [24.56496333066882]
そこで本研究では,局所的なアライメントを学習に応用して,意味のある単語・画素関係を確立する手法を提案する。
PLANは、ノイズ干渉を抑制しながら、ソフト領域認識を効果的に改善する。
PLANは、フレーズグラウンド、画像テキスト検索、オブジェクト検出、ゼロショット分類において最先端の手法を超越している。
論文 参考訳(メタデータ) (2025-02-25T10:13:13Z) - Language-guided Medical Image Segmentation with Target-informed Multi-level Contrastive Alignments [7.9714765680840625]
ターゲット型マルチレベルコントラストアライメント(TMCA)を用いた言語誘導セグメンテーションネットワークを提案する。
TMCAは、言語誘導セグメンテーションにおけるパターンギャップを橋渡しするために、ターゲット・インフォームド・クロスモダリティアライメントときめ細かいテキストガイダンスを可能にする。
論文 参考訳(メタデータ) (2024-12-18T06:19:03Z) - HoliSDiP: Image Super-Resolution via Holistic Semantics and Diffusion Prior [62.04939047885834]
本稿では,意味的セグメンテーションを活用するフレームワークであるHoliSDiPについて述べる。
本手法では, セグメンテーションマスクと空間CLIPマップを用いて, セグメンテーションガイダンスを導入しながら, セグメンテーションラベルを簡潔なテキストプロンプトとして利用する。
論文 参考訳(メタデータ) (2024-11-27T15:22:44Z) - FlowSDF: Flow Matching for Medical Image Segmentation Using Distance Transforms [60.195642571004804]
本稿では,セグメンテーションマスクの暗黙分布を表現するために,画像誘導型条件付きフローマッチングフレームワークであるFlowSDFを紹介する。
本フレームワークは,セグメンテーションマスクの正確なサンプリングと関連する統計指標の計算を可能にする。
論文 参考訳(メタデータ) (2024-05-28T11:47:12Z) - Cross-level Contrastive Learning and Consistency Constraint for
Semi-supervised Medical Image Segmentation [46.678279106837294]
半教師型医用画像セグメンテーションにおける局所特徴の表現能力を高めるためのクロスレベルコンストラシティブ学習手法を提案する。
クロスレベルなコントラスト学習と一貫性制約の助けを借りて、非ラベル付きデータを効果的に探索してセグメンテーション性能を向上させることができる。
論文 参考訳(メタデータ) (2022-02-08T15:12:11Z) - Unsupervised Bidirectional Cross-Modality Adaptation via Deeply
Synergistic Image and Feature Alignment for Medical Image Segmentation [73.84166499988443]
我々は、Synergistic Image and Feature Alignment (SIFA)と名付けられた新しい教師なしドメイン適応フレームワークを提案する。
提案するSIFAは、画像と特徴の両方の観点から、ドメインの相乗的アライメントを行う。
2つの異なるタスクに対する実験結果から,SIFA法は未ラベル対象画像のセグメンテーション性能を向上させるのに有効であることが示された。
論文 参考訳(メタデータ) (2020-02-06T13:49:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。