論文の概要: MRN: Harnessing 2D Vision Foundation Models for Diagnosing Parkinson's Disease with Limited 3D MR Data
- arxiv url: http://arxiv.org/abs/2509.17566v1
- Date: Mon, 22 Sep 2025 10:59:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.322265
- Title: MRN: Harnessing 2D Vision Foundation Models for Diagnosing Parkinson's Disease with Limited 3D MR Data
- Title(参考訳): MRN: パーキンソン病診断のための3次元MRデータを用いた2次元視覚基礎モデル
- Authors: Ding Shaodong, Liu Ziyang, Zhou Yijun, Liu Tao,
- Abstract要約: 現在の臨床実践は、しばしばQSMおよびNM-MRI画像の診断バイオマーカーに依存している。
2次元視覚基礎モデル(VFM)を活用することで,これらの課題に対処する。
提案手法はMICCAI 2025 PDCADxFoundationチャレンジにおいて,300個のQSMとNM-MRIスキャンのみを用いたデータセットで86.4%の精度で達成された。
- 参考スコア(独自算出の注目度): 0.6183104361749774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The automatic diagnosis of Parkinson's disease is in high clinical demand due to its prevalence and the importance of targeted treatment. Current clinical practice often relies on diagnostic biomarkers in QSM and NM-MRI images. However, the lack of large, high-quality datasets makes training diagnostic models from scratch prone to overfitting. Adapting pre-trained 3D medical models is also challenging, as the diversity of medical imaging leads to mismatches in voxel spacing and modality between pre-training and fine-tuning data. In this paper, we address these challenges by leveraging 2D vision foundation models (VFMs). Specifically, we crop multiple key ROIs from NM and QSM images, process each ROI through separate branches to compress the ROI into a token, and then combine these tokens into a unified patient representation for classification. Within each branch, we use 2D VFMs to encode axial slices of the 3D ROI volume and fuse them into the ROI token, guided by an auxiliary segmentation head that steers the feature extraction toward specific brain nuclei. Additionally, we introduce multi-ROI supervised contrastive learning, which improves diagnostic performance by pulling together representations of patients from the same class while pushing away those from different classes. Our approach achieved first place in the MICCAI 2025 PDCADxFoundation challenge, with an accuracy of 86.0% trained on a dataset of only 300 labeled QSM and NM-MRI scans, outperforming the second-place method by 5.5%.These results highlight the potential of 2D VFMs for clinical analysis of 3D MR images.
- Abstract(参考訳): パーキンソン病の自動診断は、その有病率と標的治療の重要性から、高い臨床需要がある。
現在の臨床実践は、しばしばQSMおよびNM-MRI画像の診断バイオマーカーに依存している。
しかし、大規模で高品質なデータセットがないため、スクラッチからオーバーフィッティングまで、診断モデルのトレーニングが困難になる。
プリトレーニングされた3D医療モデルへの適応もまた困難であり、医療画像の多様性は、ボクセル間隔のミスマッチと、事前トレーニングデータと微調整データのモダリティに繋がる。
本稿では,2次元視覚基礎モデル(VFM)を活用することで,これらの課題に対処する。
具体的には、NMおよびQSM画像から複数のキーROIを抽出し、各ROIを別々のブランチで処理し、ROIをトークンに圧縮し、これらのトークンを統一された患者表現に組み合わせて分類する。
各枝では2次元VFMを用いて3次元ROIボリュームの軸方向スライスを符号化し、特定の脳核に向けて特徴抽出を行う補助セグメンテーションヘッドで導かれるROIトークンに融合する。
さらに,同一クラスから患者表現を抽出し,異なるクラスから患者表現を抽出し,診断性能を向上させるマルチROI教師付きコントラスト学習を導入する。
提案手法はMICCAI 2025 PDCADxFoundationチャレンジにおいて,300個のラベル付きQSMとNM-MRIスキャンのデータセットで86.0%の精度で第1位となり,第2位法よりも5.5%向上した。
これらの結果は,3次元MR画像の臨床的解析における2次元VFMの有用性を浮き彫りにした。
関連論文リスト
- Building a General SimCLR Self-Supervised Foundation Model Across Neurological Diseases to Advance 3D Brain MRI Diagnoses [2.4836875944302634]
3次元脳構造MRIのための汎用高分解能SimCLRベースSSL基盤モデルを提案する。
アルツハイマー病の予測にはラベル付きトレーニングサンプルの20%しか使用していない。
論文 参考訳(メタデータ) (2025-09-12T18:05:08Z) - M3Ret: Unleashing Zero-shot Multimodal Medical Image Retrieval via Self-Supervision [24.846428105192405]
我々は、モダリティ固有のカスタマイズなしで、統一されたビジュアルエンコーダであるM3Retを訓練する。
生成的(MAE)およびコントラスト的(SimDINO)自己教師型学習(SSL)パラダイムを用いて、転送可能な表現をうまく学習する。
提案手法は,DINOv3 やテキスト教師付き BMC-CLIP などの強力なベースラインを超越して,すべてのモダリティを横断するゼロショット画像画像検索において,新たな最先端技術を実現する。
論文 参考訳(メタデータ) (2025-09-01T10:59:39Z) - Abnormality-Driven Representation Learning for Radiology Imaging [0.8321462983924758]
病変強調型コントラスト学習(LeCL)は,CTスキャンの異なる部位にわたる2次元軸方向スライスにおける異常により引き起こされる視覚的表現を得るための新しい手法である。
本研究は, 腫瘍病変位置, 肺疾患検出, 患者ステージングの3つの臨床的課題に対するアプローチを, 最先端の4つの基礎モデルと比較した。
論文 参考訳(メタデータ) (2024-11-25T13:53:26Z) - 2D and 3D Deep Learning Models for MRI-based Parkinson's Disease Classification: A Comparative Analysis of Convolutional Kolmogorov-Arnold Networks, Convolutional Neural Networks, and Graph Convolutional Networks [0.0]
本研究はパーキンソン病の診断にConvolutional Kolmogorov-Arnold Networks(ConvKANs)を適用した。
ConvKANは、構造MRIを用いたPD分類のために、学習可能なアクティベーション機能を畳み込み層に統合する。
医用画像用ConvKANの最初の3D実装について紹介し、その性能を畳み込みニューラルネットワーク(CNN)とグラフ畳み込みニューラルネットワーク(GCN)と比較した。
これらの知見は, PD検出に対するConvKANsの可能性を強調し, 脳の微妙な変化を捉える上での3D解析の重要性を強調し, データセット間の一般化の課題を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-07-24T16:04:18Z) - Multi-modal Masked Siamese Network Improves Chest X-Ray Representation Learning [46.674521557701816]
胸部X線表現の質を高めるために,Masked Siamese Network (MSN) を用いた自己教師付きプレトレーニング中に EHR データを組み込むことを提案する。
本研究は,医用画像の自己教師付き事前トレーニングの可能性を強調した。
論文 参考訳(メタデータ) (2024-07-05T12:04:12Z) - Super-resolution of biomedical volumes with 2D supervision [84.5255884646906]
超解像のための仮設スライス拡散は、生物学的標本のすべての空間次元にわたるデータ生成分布の固有同値性を利用する。
我々は,高解像度2次元画像の高速取得を特徴とするSliceRの組織学的刺激(SRH)への応用に着目する。
論文 参考訳(メタデータ) (2024-04-15T02:41:55Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - Domain Transfer Through Image-to-Image Translation for Uncertainty-Aware Prostate Cancer Classification [42.75911994044675]
前立腺MRIの非対位画像翻訳のための新しいアプローチと臨床的に重要なPCaを分類するための不確実性認識トレーニングアプローチを提案する。
提案手法では,無ペアの3.0T多パラメータ前立腺MRIを1.5Tに翻訳し,利用可能なトレーニングデータを増強する。
実験の結果,提案手法は,従来の研究に比べてAUC(Area Under ROC Curve)を20%以上改善することがわかった。
論文 参考訳(メタデータ) (2023-07-02T05:26:54Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Slice-level Detection of Intracranial Hemorrhage on CT Using Deep
Descriptors of Adjacent Slices [0.31317409221921133]
そこで本研究では,隣接するスライスのディスクリプタに基づいて,CTスキャンでエンフスライスレベルの分類器を訓練する新しい手法を提案する。
我々は、RSNA頭蓋内出血データセットの課題における、最高のパフォーマンスソリューションの上位4%において、単一のモデルを得る。
提案手法は汎用的であり,MRIなどの他の3次元診断タスクにも適用可能である。
論文 参考訳(メタデータ) (2022-08-05T23:20:37Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。