論文の概要: A Structured Review and Quantitative Profiling of Public Brain MRI Datasets for Foundation Model Development
- arxiv url: http://arxiv.org/abs/2510.20196v1
- Date: Thu, 23 Oct 2025 04:31:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:17.326959
- Title: A Structured Review and Quantitative Profiling of Public Brain MRI Datasets for Foundation Model Development
- Title(参考訳): 基礎モデル構築のためのパブリック脳MRIデータセットの構造的レビューと定量的プロファイリング
- Authors: Minh Sao Khue Luu, Margaret V. Benedichuk, Ekaterina I. Roppert, Roman M. Kenzhin, Bair N. Tuchinov,
- Abstract要約: 脳MRIの基礎モデルの開発は、利用可能なデータのスケール、多様性、一貫性に依存する。
我々は538,031以上のパブリックアクセス可能な54の脳MRIデータセットを分析し、基礎モデル開発に適した構造化されたマルチレベル概要を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of foundation models for brain MRI depends critically on the scale, diversity, and consistency of available data, yet systematic assessments of these factors remain scarce. In this study, we analyze 54 publicly accessible brain MRI datasets encompassing over 538,031 to provide a structured, multi-level overview tailored to foundation model development. At the dataset level, we characterize modality composition, disease coverage, and dataset scale, revealing strong imbalances between large healthy cohorts and smaller clinical populations. At the image level, we quantify voxel spacing, orientation, and intensity distributions across 15 representative datasets, demonstrating substantial heterogeneity that can influence representation learning. We then perform a quantitative evaluation of preprocessing variability, examining how intensity normalization, bias field correction, skull stripping, spatial registration, and interpolation alter voxel statistics and geometry. While these steps improve within-dataset consistency, residual differences persist between datasets. Finally, feature-space case study using a 3D DenseNet121 shows measurable residual covariate shift after standardized preprocessing, confirming that harmonization alone cannot eliminate inter-dataset bias. Together, these analyses provide a unified characterization of variability in public brain MRI resources and emphasize the need for preprocessing-aware and domain-adaptive strategies in the design of generalizable brain MRI foundation models.
- Abstract(参考訳): 脳MRIの基礎モデルの開発は、利用可能なデータのスケール、多様性、一貫性に大きく依存するが、これらの因子の体系的な評価は乏しい。
本研究では,538,031以上のパブリックアクセス可能な54個の脳MRIデータセットを分析し,基礎モデル開発に適した構造化されたマルチレベル概要を提供する。
データセットレベルでは、モダリティ構成、疾患カバレッジ、データセットスケールを特徴付け、大きな健康コホートとより小さな臨床集団の強い不均衡を明らかにする。
画像レベルでは、15の代表的なデータセットにまたがるボクセル間隔、向き、強度分布を定量化し、表現学習に影響を与える重要な不均一性を示す。
次に, 前処理変数の定量的評価を行い, 強度正規化, バイアス場補正, 頭蓋切削, 空間登録, 補間がボクセル統計と幾何学をどう変えるかを検討した。
これらのステップはデータセット内の一貫性を改善するが、データセット間の残差は持続する。
最後に、3D DenseNet121を用いた特徴空間ケーススタディでは、標準化前処理後の残余共変量の変化が測定可能であり、調和だけではデータセット間のバイアスを排除できないことを確認した。
これらの分析は、パブリック脳MRIリソースの多様性を統一的に評価し、一般化可能な脳MRI基盤モデルの設計において、事前処理とドメイン適応戦略の必要性を強調している。
関連論文リスト
- Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification with Swin-HAFNet [0.6840587119863303]
我々は,脳腫瘍の分類と分類に特化して設計されたBRISCという新しいMRIデータセットを提案する。
このデータセットは、放射線医や医師によって注釈された6000個の造影T1強調MRIスキャンで構成されている。
悪性腫瘍としてはグリオーマ、髄膜腫、下垂体腫瘍の3種類と非腫瘍の3種類がある。
論文 参考訳(メタデータ) (2025-06-17T08:56:05Z) - Diffusion Models for conditional MRI generation [0.0]
脳磁気共鳴画像(MRI)生成のための潜時拡散モデル(LDM)を提案する。
生成画像の品質を評価するために、Fr'echet Inception Distance(FID)とMulti-Scale Structure similarity Index(MS-SSIM)のメトリクスを使用した。
論文 参考訳(メタデータ) (2025-02-25T20:08:29Z) - Probabilistic 3D Correspondence Prediction from Sparse Unsegmented Images [1.2179682412409507]
スパース画像データから3次元対応を予測する統一モデルであるSPI-CorrNetを提案する。
LGE MRI左房データセットとAbdomen CT-1K肝データセットを用いた実験により,スパース画像駆動SSMの精度とロバスト性の向上が示された。
論文 参考訳(メタデータ) (2024-07-02T03:56:20Z) - A Demographic-Conditioned Variational Autoencoder for fMRI Distribution Sampling and Removal of Confounds [49.34500499203579]
変動型オートエンコーダ(VAE)ベースのモデルであるDemoVAEを作成し、人口統計学から fMRI の特徴を推定する。
ユーザが供給する人口動態に基づいて,高品質な合成fMRIデータを生成する。
論文 参考訳(メタデータ) (2024-05-13T17:49:20Z) - Few-shot learning for COVID-19 Chest X-Ray Classification with
Imbalanced Data: An Inter vs. Intra Domain Study [49.5374512525016]
医療画像データセットは、コンピュータ支援診断、治療計画、医学研究に使用される訓練モデルに不可欠である。
データ分散のばらつき、データの不足、ジェネリックイメージから事前トレーニングされたモデルを使用する場合の転送学習の問題などである。
本稿では,データ不足と分散不均衡の影響を軽減するために,一連の手法を統合したシームズニューラルネットワークに基づく手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T16:59:27Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。
その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。
画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文 参考訳(メタデータ) (2022-04-11T17:29:36Z) - Feature robustness and sex differences in medical imaging: a case study
in MRI-based Alzheimer's disease detection [1.7616042687330637]
我々はADNI MRIデータセットの2つの分類方式を比較した。
訓練データセットの性構成に対する男女試験対象者のモデル性能の強い依存は見つからない。
論文 参考訳(メタデータ) (2022-04-04T17:37:54Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。