論文の概要: Are Vision Foundation Models Ready for Out-of-the-Box Medical Image Registration?
- arxiv url: http://arxiv.org/abs/2507.11569v1
- Date: Tue, 15 Jul 2025 00:17:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.075113
- Title: Are Vision Foundation Models Ready for Out-of-the-Box Medical Image Registration?
- Title(参考訳): ビジョンファウンデーションモデルは、アウトオブボックスの医療画像登録の準備が整っているか?
- Authors: Hanxue Gu, Yaqian Chen, Nicholas Konz, Qihang Li, Maciej A. Mazurowski,
- Abstract要約: 大規模な画像データセットで事前トレーニングされたファンデーションモデルは、最近ゼロショット画像登録の可能性を示している。
患者の解剖学的変化が著しいため,特に乳房MRIの登録は困難である。
ドメイン固有のトレーニングが登録にどのように影響するかを理解し、グローバルアライメントと微細構造精度の両方を改善する戦略を検討するためには、さらなる作業が必要である。
- 参考スコア(独自算出の注目度): 2.2269713828088054
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation models, pre-trained on large image datasets and capable of capturing rich feature representations, have recently shown potential for zero-shot image registration. However, their performance has mostly been tested in the context of rigid or less complex structures, such as the brain or abdominal organs, and it remains unclear whether these models can handle more challenging, deformable anatomy. Breast MRI registration is particularly difficult due to significant anatomical variation between patients, deformation caused by patient positioning, and the presence of thin and complex internal structure of fibroglandular tissue, where accurate alignment is crucial. Whether foundation model-based registration algorithms can address this level of complexity remains an open question. In this study, we provide a comprehensive evaluation of foundation model-based registration algorithms for breast MRI. We assess five pre-trained encoders, including DINO-v2, SAM, MedSAM, SSLSAM, and MedCLIP, across four key breast registration tasks that capture variations in different years and dates, sequences, modalities, and patient disease status (lesion versus no lesion). Our results show that foundation model-based algorithms such as SAM outperform traditional registration baselines for overall breast alignment, especially under large domain shifts, but struggle with capturing fine details of fibroglandular tissue. Interestingly, additional pre-training or fine-tuning on medical or breast-specific images in MedSAM and SSLSAM, does not improve registration performance and may even decrease it in some cases. Further work is needed to understand how domain-specific training influences registration and to explore targeted strategies that improve both global alignment and fine structure accuracy. We also publicly release our code at \href{https://github.com/mazurowski-lab/Foundation-based-reg}{Github}.
- Abstract(参考訳): 大規模な画像データセットで事前トレーニングされ、リッチな特徴表現をキャプチャできるファンデーションモデルは、最近ゼロショット画像登録の可能性を示している。
しかし、それらの性能は、主に脳や腹部の臓器のような硬い構造や、より複雑な構造の文脈でテストされており、これらのモデルがより困難で変形可能な解剖学を扱えるかどうかは不明である。
特に、患者間の解剖学的変化、患者の位置決めによる変形、および正確なアライメントが不可欠である線維腺組織の細い複雑な内部構造の存在により、乳房MRIの登録は特に困難である。
基礎モデルに基づく登録アルゴリズムがこのレベルの複雑さに対処できるかどうかは未解決のままである。
本研究では,乳房MRIにおける基礎モデルに基づく登録アルゴリズムの総合評価を行う。
DINO-v2, SAM, MedSAM, SSLSAM, MedCLIPの5つの事前訓練エンコーダを, 経年, 経年, 経年, 経年, 経年, 経年, 経年, 病期, 病状, 病状(病変なし)の4つの主要な乳房登録タスクで評価した。
以上の結果から, SAMなどの基礎モデルに基づくアルゴリズムは, 特に大きなドメインシフトの下では, 従来の乳房アライメントにおいて, 従来の登録基準よりも優れているが, 線維腺組織の細部を捉えることに苦慮していることが明らかとなった。
興味深いことに、MedSAM や SSLSAM の医療用画像や乳房用画像に事前トレーニングや微調整を加えることで、登録性能は向上せず、場合によっては低下することもある。
ドメイン固有のトレーニングが登録にどのように影響するかを理解し、グローバルアライメントと微細構造精度の両方を改善するターゲット戦略を検討するためには、さらなる作業が必要である。
また、コードも公開しています。 \href{https://github.com/mazurowski-lab/Foundation-based-reg}{Github}。
関連論文リスト
- Beyond the LUMIR challenge: The pathway to foundational registration models [25.05315856123745]
LUMIR(Large-scale Unsupervised Brain MRI Image Registration)は、非教師なし脳MRI登録の評価と進歩を目的とした次世代ベンチマークである。
LUMIRは、ラベルマップなしでトレーニングするための4000以上の前処理されたT1強調脳MRIを提供し、生物学的に妥当な変形モデリングを促進する。
被験者は1,158名、画像ペアは4,000名以上であった。
論文 参考訳(メタデータ) (2025-05-30T03:07:58Z) - Improving Generalization of Medical Image Registration Foundation Model [12.144724550118756]
本稿では,医療画像登録における一般化と堅牢性を高めるため,シャープネス・アウェアの最小化を基礎モデルに組み込む。
実験結果から,SAMと統合された基礎モデルにより,データセット間の登録性能が大幅に向上することが確認された。
論文 参考訳(メタデータ) (2025-05-10T06:14:09Z) - Medical Image Registration Meets Vision Foundation Model: Prototype Learning and Contour Awareness [11.671950446844356]
既存の変形可能な登録法は強度に基づく類似度測定のみに依存しており、明確な解剖学的知識が欠如している。
本稿では,プロトタイプ学習と輪郭認識を取り入れた新しいSAM支援登録フレームワークを提案する。
私たちのフレームワークは、既存のメソッドを複数のデータセットで大幅に上回っています。
論文 参考訳(メタデータ) (2025-02-17T04:54:47Z) - Class Attention to Regions of Lesion for Imbalanced Medical Image
Recognition [59.28732531600606]
データ不均衡問題に対処するため,textbfClass textbfAttention to textbfRegions of the lesion (CARE)を提案する。
CAREフレームワークは、まれな疾患の病変領域を表すために、バウンディングボックスを必要とする。
その結果,自動バウンディングボックス生成によるCARE変種は,オリジナルのCAREフレームワークに匹敵することがわかった。
論文 参考訳(メタデータ) (2023-07-19T15:19:02Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - A Deep Discontinuity-Preserving Image Registration Network [73.03885837923599]
ほとんどの深層学習に基づく登録法は、所望の変形場が全世界的に滑らかで連続的であると仮定する。
本稿では、より優れた登録性能とリアルな変形場を得るために、弱い教師付き深部不連続保存画像登録ネットワーク(DDIR)を提案する。
本研究では, 心臓磁気共鳴(MR)画像の登録実験において, 登録精度を大幅に向上し, より現実的な変形を予測できることを実証した。
論文 参考訳(メタデータ) (2021-07-09T13:35:59Z) - Data-driven generation of plausible tissue geometries for realistic
photoacoustic image synthesis [53.65837038435433]
光音響トモグラフィ(pat)は形態的および機能的組織特性を回復する可能性がある。
我々は,PATデータシミュレーションの新たなアプローチを提案し,これを「シミュレーションの学習」と呼ぶ。
我々は、意味的注釈付き医療画像データに基づいて訓練されたGAN(Generative Adversarial Networks)の概念を活用して、可塑性組織ジオメトリを生成する。
論文 参考訳(メタデータ) (2021-03-29T11:30:18Z) - Multi-institutional Collaborations for Improving Deep Learning-based
Magnetic Resonance Image Reconstruction Using Federated Learning [62.17532253489087]
深層学習法はmr画像再構成において優れた性能をもたらすことが示されている。
これらの方法は、高い取得コストと医療データプライバシー規制のために収集および共有が困難である大量のデータを必要とします。
我々は,異なる施設で利用可能なmrデータを活用し,患者のプライバシーを保ちながら,連合学習(fl)ベースのソリューションを提案する。
論文 参考訳(メタデータ) (2021-03-03T03:04:40Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - Learning Deformable Registration of Medical Images with Anatomical
Constraints [4.397224870979238]
医用画像解析の分野では、変形可能な画像登録が根本的な問題である。
我々は,画像解剖学のグローバルな非線形表現をセグメンテーションマスクを用いて学習し,それらを用いて登録プロセスの制約を行う。
実験により,提案した解剖学的制約付き登録モデルにより,最先端の手法よりも現実的で正確な結果が得られることが示された。
論文 参考訳(メタデータ) (2020-01-20T17:44:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。