論文の概要: Structure-aware Semantic Discrepancy and Consistency for 3D Medical Image Self-supervised Learning
- arxiv url: http://arxiv.org/abs/2507.02581v1
- Date: Thu, 03 Jul 2025 12:40:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:16.280042
- Title: Structure-aware Semantic Discrepancy and Consistency for 3D Medical Image Self-supervised Learning
- Title(参考訳): 3次元医用画像の自己教師型学習における構造認識のセマンティックな相違と一貫性
- Authors: Tan Pan, Zhaorui Tan, Kaiyu Guo, Dongli Xu, Weidi Xu, Chen Jiang, Xin Guo, Yuan Qi, Yuan Cheng,
- Abstract要約: 構造認識表現の学習を目的とした3次元医用画像の新しい視点を提案する。
本稿では,S2DC$というmSSLフレームワークを提案する。
提案手法はmSSLにおける最先端の手法よりも一貫して優れている。
- 参考スコア(独自算出の注目度): 16.74616528864887
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: 3D medical image self-supervised learning (mSSL) holds great promise for medical analysis. Effectively supporting broader applications requires considering anatomical structure variations in location, scale, and morphology, which are crucial for capturing meaningful distinctions. However, previous mSSL methods partition images with fixed-size patches, often ignoring the structure variations. In this work, we introduce a novel perspective on 3D medical images with the goal of learning structure-aware representations. We assume that patches within the same structure share the same semantics (semantic consistency) while those from different structures exhibit distinct semantics (semantic discrepancy). Based on this assumption, we propose an mSSL framework named $S^2DC$, achieving Structure-aware Semantic Discrepancy and Consistency in two steps. First, $S^2DC$ enforces distinct representations for different patches to increase semantic discrepancy by leveraging an optimal transport strategy. Second, $S^2DC$ advances semantic consistency at the structural level based on neighborhood similarity distribution. By bridging patch-level and structure-level representations, $S^2DC$ achieves structure-aware representations. Thoroughly evaluated across 10 datasets, 4 tasks, and 3 modalities, our proposed method consistently outperforms the state-of-the-art methods in mSSL.
- Abstract(参考訳): 3次元医用画像の自己教師型学習(mSSL)は、医療分析に非常に有望である。
より広範な応用を効果的に支援するには、位置、規模、形態の解剖学的構造の変化を考慮する必要がある。
しかし、以前のmSSLメソッドはイメージを固定サイズのパッチで分割し、しばしば構造の変化を無視した。
本研究では,構造認識表現の学習を目的とした3次元医用画像の新たな視点を紹介する。
同じ構造内のパッチが同じ意味論(意味的一貫性)を共有しているのに対し、異なる構造からのパッチは異なる意味論(意味的相違)を持っていると仮定する。
この仮定に基づき、構造対応のセマンティック離散性と一貫性を2つのステップで実現したmSSLフレームワークである$S^2DC$を提案する。
まず、$S^2DC$は、最適なトランスポート戦略を活用することで意味的不一致を高めるために、異なるパッチの異なる表現を強制する。
第二に、$S^2DC$は近傍の類似度分布に基づく構造レベルでの意味的整合性を向上させる。
パッチレベルと構造レベルの表現をブリッジすることで、$S^2DC$は構造対応表現を達成する。
提案手法は,10個のデータセット,4つのタスク,3つのモダリティに対して大まかに評価され,mSSLの最先端手法よりも一貫して優れていた。
関連論文リスト
- Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文 参考訳(メタデータ) (2024-10-24T17:54:42Z) - Self-Supervised Alignment Learning for Medical Image Segmentation [26.114595114732644]
医用画像セグメンテーションのためのニューラルネットワークを事前学習するための,新たな自己教師付きアライメント学習フレームワークを提案する。
提案するフレームワークは,新たな局所的なアライメント損失とグローバルな位置損失から構成される。
実験の結果,提案したアライメント学習は,既存のCTおよびMRIデータセットの自己教師付き事前学習手法と競合することが示された。
論文 参考訳(メタデータ) (2024-06-22T00:47:39Z) - SAME++: A Self-supervised Anatomical eMbeddings Enhanced medical image
registration framework using stable sampling and regularized transformation [19.683682147655496]
本研究では,自己監督型解剖学的eMbeddingアルゴリズムを用いて,非教師付き3次元医用画像登録のための高速かつ高精度な手法を提案する。
我々は、画像登録をアフィン変換、粗い変形、深度非パラメトリック変換、インスタンス最適化の4つのステップに分割するアプローチSAM-Enhanced registration (SAME++) を命名した。
完全な登録フレームワークとして、Mate++はDiceスコアの点で、リードメソッドの4.2%$ - 8.2%$を著しく上回っている。
論文 参考訳(メタデータ) (2023-11-25T10:11:04Z) - Edge Guided GANs with Multi-Scale Contrastive Learning for Semantic
Image Synthesis [139.2216271759332]
本稿では,難解なセマンティック画像合成タスクのための新しいECGANを提案する。
セマンティックラベルは詳細な構造情報を提供しておらず、局所的な詳細や構造を合成することは困難である。
畳み込み、ダウンサンプリング、正規化といった広く採用されているCNN操作は、通常、空間分解能の損失を引き起こす。
本稿では,同じセマンティッククラスに属する画素埋め込みを強制して,より類似した画像コンテンツを生成することを目的とした,新しいコントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2023-07-22T14:17:19Z) - Anatomical Invariance Modeling and Semantic Alignment for
Self-supervised Learning in 3D Medical Image Analysis [6.87667643104543]
自己教師付き学習(SSL)は、最近、3D医療画像解析タスクで有望なパフォーマンスを達成した。
現在のほとんどの手法は、元々写真や自然画像用に設計された既存のSSLパラダイムに従っている。
我々は,解剖的不変性モデリングと意味的アライメントを明確に満たす,自己教師付き学習フレームワークAliceを提案する。
論文 参考訳(メタデータ) (2023-02-11T06:36:20Z) - PCRLv2: A Unified Visual Information Preservation Framework for
Self-supervised Pre-training in Medical Image Analysis [56.63327669853693]
本稿では,ピクセルレベルの情報を高レベルなセマンティクスに明示的にエンコードするための画素復元タスクを提案する。
また,画像理解を支援する強力なツールであるスケール情報の保存についても検討する。
提案されている統合SSLフレームワークは、さまざまなタスクで自己管理されたフレームワークを超越している。
論文 参考訳(メタデータ) (2023-01-02T17:47:27Z) - HSVA: Hierarchical Semantic-Visual Adaptation for Zero-Shot Learning [74.76431541169342]
ゼロショット学習(ZSL)は、目に見えないクラス認識の問題に取り組み、目に見えないクラスから目に見えないクラスに意味的な知識を移す。
本稿では,意味領域と視覚領域を協調させる新しい階層型意味視覚適応(HSVA)フレームワークを提案する。
4つのベンチマークデータセットの実験では、HSVAは従来のZSLと一般的なZSLの両方で優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-30T14:27:50Z) - Edge Guided GANs with Contrastive Learning for Semantic Image Synthesis [194.1452124186117]
本稿では,難解なセマンティック画像合成タスクのための新しいECGANを提案する。
我々のECGANは最先端の手法よりもはるかに優れた結果が得られる。
論文 参考訳(メタデータ) (2020-03-31T01:23:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。