論文の概要: Foundation Models in Medical Image Analysis: A Systematic Review and Meta-Analysis
- arxiv url: http://arxiv.org/abs/2510.16973v1
- Date: Sun, 19 Oct 2025 19:19:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.228844
- Title: Foundation Models in Medical Image Analysis: A Systematic Review and Meta-Analysis
- Title(参考訳): 医用画像解析の基礎モデル : システムレビューとメタ分析
- Authors: Praveenbalaji Rajendran, Mojtaba Safari, Wenfeng He, Mingzhe Hu, Shansong Wang, Jun Zhou, Xiaofeng Yang,
- Abstract要約: ファンデーションモデル(FM)は、医療画像解析に革命をもたらし、様々な医療画像タスクにおいて、ゼロショットと少数ショットのパフォーマンスを強く証明している。
FMは、ラベル付きおよびラベルなしのマルチモーダルデータセットの大規模なコーパスを利用して、一般化された表現を学習する。
医療画像におけるFM研究の急速な普及にもかかわらず、フィールドは断片化されている。
本稿では,医療画像解析におけるFMの包括的かつ構造化された分析について述べる。
- 参考スコア(独自算出の注目度): 7.905460364844281
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advancements in artificial intelligence (AI), particularly foundation models (FMs), have revolutionized medical image analysis, demonstrating strong zero- and few-shot performance across diverse medical imaging tasks, from segmentation to report generation. Unlike traditional task-specific AI models, FMs leverage large corpora of labeled and unlabeled multimodal datasets to learn generalized representations that can be adapted to various downstream clinical applications with minimal fine-tuning. However, despite the rapid proliferation of FM research in medical imaging, the field remains fragmented, lacking a unified synthesis that systematically maps the evolution of architectures, training paradigms, and clinical applications across modalities. To address this gap, this review article provides a comprehensive and structured analysis of FMs in medical image analysis. We systematically categorize studies into vision-only and vision-language FMs based on their architectural foundations, training strategies, and downstream clinical tasks. Additionally, a quantitative meta-analysis of the studies was conducted to characterize temporal trends in dataset utilization and application domains. We also critically discuss persistent challenges, including domain adaptation, efficient fine-tuning, computational constraints, and interpretability along with emerging solutions such as federated learning, knowledge distillation, and advanced prompting. Finally, we identify key future research directions aimed at enhancing the robustness, explainability, and clinical integration of FMs, thereby accelerating their translation into real-world medical practice.
- Abstract(参考訳): 人工知能(AI)の最近の進歩、特に基礎モデル(FM)は医療画像解析に革命をもたらした。
従来のタスク固有のAIモデルとは異なり、FMはラベル付きおよびラベルなしのマルチモーダルデータセットの大規模なコーパスを利用して、さまざまな下流臨床応用に適用可能な一般化された表現を最小限の微調整で学習する。
しかし、医療画像におけるFM研究の急速な普及にもかかわらず、この領域は断片化され続けており、アーキテクチャの進化を体系的にマッピングする統一的な合成、訓練パラダイム、およびモダリティを越えた臨床応用が欠如している。
本報告では,医療画像解析におけるFMの包括的かつ構造化された分析について述べる。
本研究は,建築基盤,トレーニング戦略,下流臨床課題に基づいて,視覚のみのFMと視覚言語によるFMに分類する。
さらに,データセットの利用状況と応用領域の時間的傾向を特徴付けるために,定量的メタ分析を行った。
また, ドメイン適応, 効率的な微調整, 計算制約, 解釈可能性, フェデレートラーニング, 知識蒸留, 先進的プロンプトといった新しいソリューションについても批判的に論じる。
最後に, FMの堅牢性, 説明可能性, 臨床統合性を高めることを目的とした研究の方向性を明らかにし, 現実の医療実践への転換を加速させる。
関連論文リスト
- Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Brain Imaging Foundation Models, Are We There Yet? A Systematic Review of Foundation Models for Brain Imaging and Biomedical Research [6.113042369956893]
ファンデーションモデル(FM)は人工知能に革命をもたらし、医療画像において大きな可能性を秘めている。
脳画像は、神経疾患の診断と治療において重要な役割を担っているにもかかわらず、まだ表現されていない。
脳画像のためのFMの総合的およびキュレートされたレビューを初めて紹介する。
論文 参考訳(メタデータ) (2025-06-16T09:46:46Z) - Vision Foundation Models in Medical Image Analysis: Advances and Challenges [7.224426395050136]
ビジョンファウンデーションモデル(VFM)は、医療画像解析の分野で大きな進歩をもたらした。
本稿では,VFMの医用画像セグメンテーションへの適応に関する現状研究について概説する。
本稿では,アダプタによる改良,知識蒸留技術,マルチスケール・コンテキスト特徴モデリングの最近の発展について論じる。
論文 参考訳(メタデータ) (2025-02-20T14:13:46Z) - A Survey on Computational Pathology Foundation Models: Datasets, Adaptation Strategies, and Evaluation Tasks [22.806228975730008]
計算病理基盤モデル (CPathFMs) は, 組織学的データを解析するための強力なアプローチとして出現している。
これらのモデルは、セグメンテーション、分類、バイオマーカー発見のような複雑な病理タスクを自動化することを約束している。
しかし、CPathFMsの開発は、データアクセシビリティの制限、データセット間の高いばらつき、標準化された評価ベンチマークの欠如など、大きな課題を呈している。
論文 参考訳(メタデータ) (2025-01-27T01:27:59Z) - Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-29T23:19:28Z) - fMRI-PTE: A Large-scale fMRI Pretrained Transformer Encoder for
Multi-Subject Brain Activity Decoding [54.17776744076334]
本稿では,fMRI事前学習のための革新的オートエンコーダであるfMRI-PTEを提案する。
我々のアプローチでは、fMRI信号を統合された2次元表現に変換し、次元の整合性を確保し、脳の活動パターンを保存する。
コントリビューションには、fMRI-PTEの導入、革新的なデータ変換、効率的なトレーニング、新しい学習戦略、そして我々のアプローチの普遍的な適用性が含まれる。
論文 参考訳(メタデータ) (2023-11-01T07:24:22Z) - Cross-Modal Information Maximization for Medical Imaging: CMIM [62.28852442561818]
病院では、同じ情報を異なるモダリティの下で利用できるようにする特定の情報システムにデータがサイロ化される。
これは、テスト時に常に利用できないかもしれない同じ情報の複数のビューを列車で取得し、使用するためのユニークな機会を提供する。
テスト時にモダリティの低下に耐性を持つマルチモーダル入力の優れた表現を学習することで、利用可能なデータを最大限活用する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-20T20:05:35Z) - Domain Shift in Computer Vision models for MRI data analysis: An
Overview [64.69150970967524]
機械学習とコンピュータビジョン手法は、医用画像解析において優れた性能を示している。
しかし、現在臨床応用はごくわずかである。
異なるソースや取得ドメインのデータへのモデルの不適切な転送性は、その理由の1つです。
論文 参考訳(メタデータ) (2020-10-14T16:34:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。