論文の概要: Benchmarking CXR Foundation Models With Publicly Available MIMIC-CXR and NIH-CXR14 Datasets
- arxiv url: http://arxiv.org/abs/2512.06014v1
- Date: Wed, 03 Dec 2025 12:55:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.150824
- Title: Benchmarking CXR Foundation Models With Publicly Available MIMIC-CXR and NIH-CXR14 Datasets
- Title(参考訳): MIMIC-CXRとNIH-CXR14データセットを用いたCXRファンデーションモデルのベンチマーク
- Authors: Jiho Shin, Dominic Marshall, Matthieu Komorowski,
- Abstract要約: この研究は、パブリックMIMIC-CRとNIH ChestX-ray14データセットに2つの大規模胸部X線埋め込みモデル(CXR)をベンチマークする。
トレーニング済みエンコーダから直接埋め込みを抽出し,複数ラベルの軽量LightGBM分類器を訓練し,平均AUROC,F1スコアを95%の信頼区間で報告した。
- 参考スコア(独自算出の注目度): 0.35441912284181126
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent foundation models have demonstrated strong performance in medical image representation learning, yet their comparative behaviour across datasets remains underexplored. This work benchmarks two large-scale chest X-ray (CXR) embedding models (CXR-Foundation (ELIXR v2.0) and MedImagelnsight) on public MIMIC-CR and NIH ChestX-ray14 datasets. Each model was evaluated using a unified preprocessing pipeline and fixed downstream classifiers to ensure reproducible comparison. We extracted embeddings directly from pre-trained encoders, trained lightweight LightGBM classifiers on multiple disease labels, and reported mean AUROC, and F1-score with 95% confidence intervals. MedImageInsight achieved slightly higher performance across most tasks, while CXR-Foundation exhibited strong cross-dataset stability. Unsupervised clustering of MedImageIn-sight embeddings further revealed a coherent disease-specific structure consistent with quantitative results. The results highlight the need for standardised evaluation of medical foundation models and establish reproducible baselines for future multimodal and clinical integration studies.
- Abstract(参考訳): 近年の基盤モデルは, 医用画像表現学習において高い性能を示したが, データセット間の比較行動は未解明のままである。
この研究は、公開MIMIC-CRとNIH ChestX-ray14データセット上の2つの大規模胸部X線(CXR)埋め込みモデル(CXR-Foundation (ELIXR v2.0)とMedImagelnsight)をベンチマークする。
各モデルは、再現可能な比較を保証するために、統一された前処理パイプラインと固定された下流分類器を用いて評価された。
トレーニング済みエンコーダから直接埋め込みを抽出し,複数の疾患ラベルに軽量LightGBM分類器を訓練し,平均AUROC,F1スコアを95%の信頼区間で報告した。
MedImageInsightは、ほとんどのタスクで若干高いパフォーマンスを実現し、CXR-Foundationは、強力なクロスデータセット安定性を示した。
MedImageIn-sight 埋め込みの無監督クラスタリングにより, 定量的な結果と一致したコヒーレントな疾患特異的構造が明らかにされた。
その結果, 医療基盤モデルの標準化と, 今後の多施設・臨床統合研究のための再現性ベースラインの確立の必要性が浮き彫りとなった。
関連論文リスト
- Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - Fairness and Robustness of CLIP-Based Models for Chest X-rays [9.082174810187931]
胸部X線分類におけるCLIPをベースとした6つのモデルについて,3つの公開データセットを用いて広範囲に評価した。
年齢,性別,人種に基づいて,6つの条件および患者サブグループにまたがるモデルフェアネスを評価する。
以上の結果から,異なる年齢の患者間での成績差が示唆された。
論文 参考訳(メタデータ) (2025-07-28T19:25:16Z) - Chest X-ray Foundation Model with Global and Local Representations Integration [13.736829173377355]
CheXFoundは、堅牢なCXR表現を学び、幅広い下流タスクを効果的に一般化するビジョン基盤モデルである。
我々はCheXFoundをキュレートしたCXR-1Mデータセットで事前訓練し、公開ソースから100万以上のユニークなCXRを作成した。
以上の結果から,CheXFoundは有病率の異なる40の疾患の分類において,最先端モデルよりも優れていた。
論文 参考訳(メタデータ) (2025-02-07T18:16:15Z) - CXPMRG-Bench: Pre-training and Benchmarking for X-ray Medical Report Generation on CheXpert Plus Dataset [14.911363203907008]
X線画像に基づく医療報告生成は、診断上の負担と患者待ち時間を著しく削減することができる。
我々は、CheXpert Plusデータセット上で、既存の主流X線レポート生成モデルと大規模言語モデル(LLM)の包括的なベンチマークを行う。
自己教師付き自己回帰生成やX線レポートによるコントラスト学習を含む,多段階事前学習戦略を用いたX線画像生成のための大規模モデルを提案する。
論文 参考訳(メタデータ) (2024-10-01T04:07:01Z) - Revisiting Computer-Aided Tuberculosis Diagnosis [56.80999479735375]
結核(TB)は世界的な健康上の脅威であり、毎年何百万人もの死者を出している。
深層学習を用いたコンピュータ支援結核診断 (CTD) は有望であるが, 限られたトレーニングデータによって進行が妨げられている。
結核X線(TBX11K)データセットは11,200個の胸部X線(CXR)画像とそれに対応するTB領域のバウンディングボックスアノテーションを含む。
このデータセットは、高品質なCTDのための洗練された検出器のトレーニングを可能にする。
論文 参考訳(メタデータ) (2023-07-06T08:27:48Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - MedFuse: Multi-modal fusion with clinical time-series data and chest
X-ray images [3.6615129560354527]
マルチモーダルフュージョンアプローチは、異なるデータソースからの情報を統合することを目的としている。
オーディオ・ビジュアル・アプリケーションのような自然なデータセットとは異なり、医療におけるデータは非同期に収集されることが多い。
We propose MedFuse, a conceptly simple yet promising LSTM-based fusion module that can accommodate uni-modal as multi-modal input。
論文 参考訳(メタデータ) (2022-07-14T15:59:03Z) - Improving Classification Model Performance on Chest X-Rays through Lung
Segmentation [63.45024974079371]
本稿では, セグメンテーションによる異常胸部X線(CXR)識別性能を向上させるための深層学習手法を提案する。
提案手法は,CXR画像中の肺領域を局所化するための深層ニューラルネットワーク(XLSor)と,大規模CXRデータセットで事前学習した自己教師あり運動量コントラスト(MoCo)モデルのバックボーンを用いたCXR分類モデルである。
論文 参考訳(メタデータ) (2022-02-22T15:24:06Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。