論文の概要: Anatomy-Anchored Self-Supervision: Distilling Vision Foundation Models for Invariant Ultrasound Representation
- arxiv url: http://arxiv.org/abs/2605.25402v2
- Date: Tue, 02 Jun 2026 02:03:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 18:57:50.054274
- Title: Anatomy-Anchored Self-Supervision: Distilling Vision Foundation Models for Invariant Ultrasound Representation
- Title(参考訳): 解剖学的アンコール型自己スーパービジョン:不変超音波表現のための蒸留ビジョン基礎モデル
- Authors: Chunzheng Zhu, Yijun Wang, Jianxin Lin, Feng Wang, Hongwei Wang, Lei Zhao, Shengli Li, Kenli Li,
- Abstract要約: 自己指導型事前訓練パラダイムは, 医用画像における伝達可能な表現の学習において, 優位性を高めている。
一般的な視覚領域から臨床的に有意な解剖構造へ表現学習を移行させる解剖学的アンコール超音波自己監督フレームワークANAUSを提案する。
- 参考スコア(独自算出の注目度): 29.61647712180762
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised pre-training paradigm has gained increasing prominence for learning transferable representations in medical imaging, yet existing methods for ultrasound (US) images operate at the image or frame level, overlooking the anatomical context for clinical-aligned representation learning. In this work, we propose an anatomy-anchored ultrasound self-supervision framework ANAUS that shifts representation learning from generic visual regions to clinically meaningful anatomical structures. Utilizing a learnable latent prompt engine alongside a one-time domain adaptation on existing public image--mask pairs, we empower the LP-SAM module to achieve annotation-free anatomy delineation at scale. Building upon this anatomical grounding, we propose a dual-policy self-supervised learning paradigm consisting of inter-view semantics-aware anatomy-separating alignment and contextual core-region prediction to enhance representation learning. Specifically, the former enforces feature invariance within identical anatomical regions while promoting discriminability across distinct structures; the latter compels the model to reconstruct corrupted regions, thereby capturing fine-grained structural details. Extensive evaluations on six public datasets demonstrate that \ours{} consistently outstrips current state-of-the-art methods while maintaining the computational efficiency essential for clinical deployment. Code is available at https://github.com/zhcz328/ANAUS.
- Abstract(参考訳): 自己指導型プレトレーニングパラダイムは, 医用画像における伝達可能な表現の学習において, 注目度が高くなっているが, 既存の超音波(US)画像は画像やフレームレベルで動作し, 臨床に整合した表現学習の解剖学的文脈を見渡すことができる。
本研究では,一般的な視覚領域から臨床的に有意な解剖構造へ表現学習を移行させる解剖学的アンコール超音波自己監督フレームワークANAUSを提案する。
学習可能な潜伏プロンプトエンジンと,既存のパブリックイメージ-マスクペアへの1回ドメイン適応を活用することで,LP-SAMモジュールを大規模にアノテーションのない解剖記述を実現することができる。
この解剖学的基盤を基盤として、ビュー間セマンティクスを意識した解剖学的アライメントと、表現学習を強化するための文脈的中核領域予測からなる双対政治自己教師型学習パラダイムを提案する。
具体的には、前者は、同一の解剖学的領域内での特徴的不変性を強制し、異なる構造をまたいだ識別性を推進し、後者は、崩壊した領域を再構築するモデルを補完し、きめ細かい構造的詳細をキャプチャする。
6つの公開データセットの大規模な評価は、‘ours{}’が、臨床展開に必要な計算効率を維持しながら、現在の最先端の手法を一貫して超越していることを示している。
コードはhttps://github.com/zhcz328/ANAUSで公開されている。
関連論文リスト
- Retrieval-Augmented Anatomical Guidance for Text-to-CT Generation [1.5532758127091075]
本研究では,現実的な推論環境下で意味情報と解剖情報を統合したテキスト・ツー・CT生成のための検索拡張手法を提案する。
CT-RATEデータセットを用いた実験により,検索拡張生成は,テキストのみのベースラインに比べて画像の忠実度と臨床整合性を向上することが示された。
本研究は,容積医用画像合成における意味的条件付けと解剖学的妥当性を橋渡しする,原則的かつスケーラブルな機構を導入する。
論文 参考訳(メタデータ) (2026-03-09T12:27:17Z) - Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.350584471060756]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。
本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。
SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文 参考訳(メタデータ) (2025-09-30T08:59:06Z) - GRASPing Anatomy to Improve Pathology Segmentation [67.98147643529309]
本稿では,病的セグメンテーションモデルを強化するモジュール型プラグイン・アンド・プレイフレームワークGRASPを紹介する。
2つのPET/CTデータセット上でGRASPを評価し、系統的アブレーション研究を行い、フレームワークの内部動作について検討する。
論文 参考訳(メタデータ) (2025-08-05T12:26:36Z) - CheXLearner: Text-Guided Fine-Grained Representation Learning for Progression Detection [14.414457048968439]
我々は、解剖学的領域の検出、構造的アライメント、意味的ガイダンスを統合する最初のエンドツーエンドフレームワークであるCheXLearnerを紹介する。
提案したMed-Manifold Alignment Module (Med-MAM) は双曲幾何学を利用して解剖学的構造を強固に整列させる。
本モデルでは,下流疾患分類における平均AUCスコアが91.52%に達し,その優れた特徴表現が検証された。
論文 参考訳(メタデータ) (2025-05-11T08:51:38Z) - Anatomical Structure-Guided Medical Vision-Language Pre-training [21.68719061251635]
医用視覚表現を学習するための解剖学的構造ガイド(ASG)フレームワークを提案する。
解剖学的領域に対しては,放射線技師と協調して自動解剖学的領域文アライメントパラダイムを設計する。
画像の特徴を各サンプル内の各タグに関連付けるために,画像タグ認識デコーダを適用して画像タグとみなす。
論文 参考訳(メタデータ) (2024-03-14T11:29:47Z) - Bayesian Unsupervised Disentanglement of Anatomy and Geometry for Deep Groupwise Image Registration [59.062085785106234]
本稿では,マルチモーダル群画像登録のための一般ベイズ学習フレームワークを提案する。
本稿では,潜在変数の推論手順を実現するために,新しい階層的変分自動符号化アーキテクチャを提案する。
心臓、脳、腹部の医療画像から4つの異なるデータセットを含む,提案された枠組みを検証する実験を行った。
論文 参考訳(メタデータ) (2024-01-04T08:46:39Z) - Region-based Contrastive Pretraining for Medical Image Retrieval with
Anatomic Query [56.54255735943497]
医用画像検索のための地域別コントラスト事前トレーニング(RegionMIR)
医用画像検索のための領域ベースコントラスト事前トレーニング(RegionMIR)について紹介する。
論文 参考訳(メタデータ) (2023-05-09T16:46:33Z) - Stain based contrastive co-training for histopathological image analysis [61.87751502143719]
本稿では,ヒストリボリューション画像の分類のための,新しい半教師付き学習手法を提案する。
我々は、半教師付き学習フレームワークを作成するために、パッチレベルのアノテーションと、新しいコトレーニング損失を併用した強力な監視を採用する。
透明細胞腎細胞および前立腺癌に対するアプローチを評価し,最先端の半教師あり学習法の改善を実証した。
論文 参考訳(メタデータ) (2022-06-24T22:25:31Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - Learning to Segment Anatomical Structures Accurately from One Exemplar [34.287877547953194]
大量の注釈付きトレーニング画像を用いることなく、正確な解剖学的構造セグメンテーションを作成できる方法は、非常に望ましい。
本研究では,自然に組み込まれたループ機構を備えたワンショット解剖セグメントであるContour Transformer Network (CTN)を提案する。
筆者らのワンショット学習法は,非学習に基づく手法を著しく上回り,最先端の完全教師付きディープラーニングアプローチと競争的に機能することを示した。
論文 参考訳(メタデータ) (2020-07-06T20:27:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。