論文の概要: FoMoH: A clinically meaningful foundation model evaluation for structured electronic health records
- arxiv url: http://arxiv.org/abs/2505.16941v1
- Date: Thu, 22 May 2025 17:29:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.499338
- Title: FoMoH: A clinically meaningful foundation model evaluation for structured electronic health records
- Title(参考訳): FoMoH:構造化電子健康記録のための臨床的意義のある基礎モデル評価
- Authors: Chao Pang, Vincent Jeanselme, Young Sang Choi, Xinzhuo Jiang, Zilin Jing, Aparajita Kashyap, Yuta Kobayashi, Yanwei Li, Florent Pollet, Karthik Natarajan, Shalmali Joshi,
- Abstract要約: ファンデーションモデルは、下流のタスクとは無関係に意味のある表現を抽出する能力を考えると、医療において大きな可能性を秘めている。
包括的かつ有意義なタスクのデシダラタが欠如していることから、これらのモデルが臨床的有用性にもたらす可能性については、ほとんど意見の一致がない。
コロンビア大学アーヴィング医療センターの500万人の患者を対象に, EHRデータに基づく最先端基礎モデルの評価を行った。
- 参考スコア(独自算出の注目度): 15.619686828044543
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation models hold significant promise in healthcare, given their capacity to extract meaningful representations independent of downstream tasks. This property has enabled state-of-the-art performance across several clinical applications trained on structured electronic health record (EHR) data, even in settings with limited labeled data, a prevalent challenge in healthcare. However, there is little consensus on these models' potential for clinical utility due to the lack of desiderata of comprehensive and meaningful tasks and sufficiently diverse evaluations to characterize the benefit over conventional supervised learning. To address this gap, we propose a suite of clinically meaningful tasks spanning patient outcomes, early prediction of acute and chronic conditions, including desiderata for robust evaluations. We evaluate state-of-the-art foundation models on EHR data consisting of 5 million patients from Columbia University Irving Medical Center (CUMC), a large urban academic medical center in New York City, across 14 clinically relevant tasks. We measure overall accuracy, calibration, and subpopulation performance to surface tradeoffs based on the choice of pre-training, tokenization, and data representation strategies. Our study aims to advance the empirical evaluation of structured EHR foundation models and guide the development of future healthcare foundation models.
- Abstract(参考訳): ファンデーションモデルは、下流のタスクとは無関係に意味のある表現を抽出する能力を考えると、医療において大きな可能性を秘めている。
この特性は、構造化された電子健康記録(EHR)データに基づいてトレーニングされたいくつかの臨床応用における最先端のパフォーマンスを可能にした。
しかし、包括的で有意義な課題のデシデラタが欠如していることや、従来の教師付き学習よりも利点を特徴づける十分な多彩な評価のために、これらのモデルが臨床的有用性にもたらす可能性についてはほとんど合意が得られていない。
このギャップに対処するため, 患者結果にまたがる臨床的に有意義な課題, 急性および慢性の早期予測, 堅牢な評価のためのデシデラタなどを提案する。
ニューヨーク市にある大都市大学医療センターであるコロンビア大学アーヴィング医療センター(CUMC)の500万人の患者を対象とし,臨床関連課題14件についてEHRデータに基づく基礎モデルの評価を行った。
我々は、事前学習、トークン化、データ表現戦略の選択に基づいて、全体的な精度、キャリブレーション、サブポピュレーション性能を表面トレードオフに測定する。
本研究は, 構造化EHRファンデーションモデルの実証評価を推進し, 将来の医療ファンデーションモデルの開発を指導することを目的とする。
関連論文リスト
- Foundation models for electronic health records: representation dynamics and transferability [0.16070672161045726]
電子健康記録に基づいてトレーニングされたファンデーションモデル(FM)は、様々な臨床予測タスクにおいて高いパフォーマンスを示した。
シカゴ大学メディカルセンターにおいて,MIMIC-IVで訓練したFMの施設EHRデータセットへの転送可能性について検討した。
外来患者を識別する能力について検討し, 今後の臨床成績との関連性について検討した。
論文 参考訳(メタデータ) (2025-04-14T17:09:05Z) - Zero-shot Medical Event Prediction Using a Generative Pre-trained Transformer on Electronic Health Records [8.575985305475355]
EHRで訓練された基礎モデルはゼロショット方式で予測タスクを実行できることを示す。
広範囲なラベル付きデータを必要とする教師付きアプローチとは違って,本手法では,事前学習した知識から,次の医療イベントを純粋に予測することができる。
論文 参考訳(メタデータ) (2025-03-07T19:26:47Z) - Recent Advances in Predictive Modeling with Electronic Health Records [71.19967863320647]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - Evaluating the Fairness of the MIMIC-IV Dataset and a Baseline
Algorithm: Application to the ICU Length of Stay Prediction [65.268245109828]
本稿では、MIMIC-IVデータセットを用いて、滞在時間を予測するXGBoostバイナリ分類モデルにおける公平性とバイアスについて検討する。
この研究は、人口統計属性にわたるデータセットのクラス不均衡を明らかにし、データ前処理と特徴抽出を採用する。
この論文は、偏見を緩和するための公正な機械学習技術と、医療専門家とデータサイエンティストの協力的な努力の必要性について結論付けている。
論文 参考訳(メタデータ) (2023-12-31T16:01:48Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - The Shaky Foundations of Clinical Foundation Models: A Survey of Large
Language Models and Foundation Models for EMRs [5.7482228499062975]
非イメージングEMRデータに基づいて訓練された80以上の基礎モデルをレビューする。
ほとんどのモデルが、小さく、狭められた臨床データセットでトレーニングされていることが分かりました。
臨床基礎モデルの利点を評価するための評価フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-22T23:54:14Z) - On the Importance of Clinical Notes in Multi-modal Learning for EHR Data [0.0]
電子健康記録データと臨床ノートを併用することにより,患者モニタリングの予測性能が向上することが従来研究で示されている。
EHRデータと臨床ノートを組み合わせることで、最先端のEHRデータモデルよりもパフォーマンスが大幅に向上することを確認した。
次に、臨床医のメモよりも、患者の状態に関するより広い文脈を含むメモのサブセットから、改善がほぼ排他的に生じることを示す分析を行った。
論文 参考訳(メタデータ) (2022-12-06T15:18:57Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。