論文の概要: Cohort-Anchored Foundation Models for Electronic Health Records: From Risk Scores to Auditable Peer Cohorts
- arxiv url: http://arxiv.org/abs/2606.21885v1
- Date: Sat, 20 Jun 2026 05:14:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 02:26:14.343217
- Title: Cohort-Anchored Foundation Models for Electronic Health Records: From Risk Scores to Auditable Peer Cohorts
- Title(参考訳): Cohort-Anchored Foundation Models for Electronic Health Records: From Risk Scores to Auditable Peer Cohorts
- Authors: Kaiping Zheng,
- Abstract要約: 本稿では,患者コホートを学習パイプライン全体を通じて一級対象に高めるためのコホート・アンコレッド財団モデルフレームワークを提案する。
このフレームワークは、偏差認識データキュレーション、コホート条件付きプレトレーニング、マルチモーダルコホートアライメント、クリニアン・イン・ザ・ループ・リファインメントの4つのステージで構成されている。
心電図による急性腎傷害予測,心血管性リスク層形成,眼神経障害三徴症,網膜電図による報告の4つの臨床症例について検討した。
- 参考スコア(独自算出の注目度): 3.299672391663527
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation models have achieved remarkable performance across medical question answering, imaging, and electronic health record (EHR) tasks, yet reliable clinical deployment remains challenging due to limited interpretability, vulnerability to distribution shift, and weak alignment with clinician reasoning. We argue that these limitations arise because existing approaches prioritize representation learning while treating patient comparison as an emergent property rather than a primary source of clinical evidence. To address this gap, we propose CAFM, a Cohort-Anchored Foundation Model framework that elevates patient cohorts to a first-class object throughout the learning pipeline. The framework consists of four stages: deviation-aware data curation, cohort-conditioned pretraining, multimodal cohort alignment, and clinician-in-the-loop refinement. Together, these stages improve data quality, organize representations around clinically meaningful cohort structure, preserve modality-specific relationships, and support auditable clinical decision-making. The framework is compositional and can augment existing EHR foundation models without modifying their underlying encoders. We illustrate CAFM through four clinical case studies spanning acute kidney injury prediction, cardiovascular risk stratification from electrocardiograms, optic neuropathy triage from orbital imaging, and electroretinogram-grounded report generation. We further present five empirically testable hypotheses and identify open challenges in data quality, irregular temporality, multimodal learning, distribution shift, and evaluation beyond predictive accuracy. We argue that explicitly anchoring foundation models to patient cohorts provides a principled path toward trustworthy clinical AI.
- Abstract(参考訳): 基礎モデルは、医療質問応答、イメージング、電子健康記録(EHR)タスクで顕著なパフォーマンスを達成したが、信頼性のある臨床展開は、限定的な解釈可能性、分布シフトへの脆弱性、臨床の推論との整合性の弱いため、依然として困難である。
これらの制約は、患者比較を臨床証拠の主な源ではなく、創発的特性として扱いながら、既存のアプローチが表現学習を優先していることから生じると我々は主張する。
このギャップに対処するために,患者コホートを学習パイプライン全体を通して一級オブジェクトに高めるコホート・アンコール財団モデルフレームワークであるCAFMを提案する。
このフレームワークは、偏差認識データキュレーション、コホート条件付きプレトレーニング、マルチモーダルコホートアライメント、クリニアン・イン・ザ・ループ・リファインメントの4つのステージで構成されている。
これらの段階は、データ品質を改善し、臨床的に意味のあるコホート構造に関する表現を整理し、モダリティ特異的な関係を維持し、監査可能な臨床的意思決定をサポートする。
フレームワークは構成的であり、基盤となるエンコーダを変更することなく既存のEHRファウンデーションモデルを拡張できる。
心電図による急性腎傷害予測,心血管性リスク層形成,眼神経障害三徴症,網膜電図による報告の4つの臨床症例について検討した。
さらに,データ品質,不規則な時間性,マルチモーダル学習,分布シフト,予測精度を超えた評価において,実証可能な5つの仮説を提示する。
我々は、ファンデーションモデルを患者コホートに明示的に固定することは、信頼できる臨床AIへの原則的な道をもたらすと論じている。
関連論文リスト
- A Machine Learning-Based Framework for Discovering Huntington's Disease Stages: Integrating Graph Representation Learning and clustering to Uncover Progression Dynamics in Longitudinal Enroll-HD Dataset [1.9449105330280387]
ハンティントン病(英: Huntington's disease、HD)は、運動、認知機能、行動に徐々に影響を及ぼす進行性脳障害である。
我々は,動的グラフ表現学習に基づく教師なし機械学習フレームワークを開発し,患者内および患者間の時間的関係を捉える。
本フレームワークをEnroll-HDコホートから302名(訪問1,477名,訪問44名,参加者80%)に適用し,HDステージのデータ駆動による発見を可能にした。
論文 参考訳(メタデータ) (2026-06-04T14:04:04Z) - ReMedi: Reasoner for Medical Clinical Prediction [70.84466325266068]
EHRによる臨床結果予測を改善するためのフレームワークであるReMediを提案する。
ReMediは、複雑な臨床問題に対する挑戦的なサンプル再生機構を用いて有理応答対を生成する。
複数のEHR予測タスクの実験では、F1スコアで最先端のベースラインを19.9%上回った。
論文 参考訳(メタデータ) (2026-05-02T14:44:49Z) - DISCO-TAB: A Hierarchical Reinforcement Learning Framework for Privacy-Preserving Synthesis of Complex Clinical Data [2.3915781021862332]
DISCO-TABは、Reinforcement Learningによって最適化された多目的識別器システムを用いて、微調整LDMをオーケストレーションする新しいフレームワークである。
私たちは、高次元の小さな医療データセットを含むさまざまなベンチマークで、私たちのフレームワークを厳格に検証しています。
以上の結果から, 階層的フィードバックは最先端の成果をもたらすことが示され, 下流の臨床的有用性は最大38.2%向上した。
論文 参考訳(メタデータ) (2026-04-01T23:37:58Z) - Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - Cross-Linguistic Persona-Driven Data Synthesis for Robust Multimodal Cognitive Decline Detection [20.599682298329213]
我々は、制御可能なゼロショットマルチモーダルデータ合成とChain-of-Thought deductionファインチューニングを統合する新しいフレームワークであるSynCogを紹介する。
この生成パラダイムは、様々な言語にまたがる臨床コーパスの迅速でゼロショット展開を可能にする。
ADReSSとADReSSoベンチマークの実験は、限られた臨床データを合成表現型で増強することで、競争力のある診断性能が得られることを示した。
論文 参考訳(メタデータ) (2026-02-08T14:10:05Z) - AgentsEval: Clinically Faithful Evaluation of Medical Imaging Reports via Multi-Agent Reasoning [73.50200033931148]
本稿では,放射線科医の協調診断ワークフローをエミュレートしたマルチエージェントストリーム推論フレームワークであるAgensEvalを紹介する。
評価プロセスを基準定義、エビデンス抽出、アライメント、一貫性スコアなどの解釈可能なステップに分割することで、AgensEvalは明確な推論トレースと構造化された臨床フィードバックを提供する。
実験結果から,AgensEvalは,言い換え,意味的,スタイリスティックな摂動の下でも頑健な臨床的整合性,意味的忠実性,解釈可能な評価を提供することが示された。
論文 参考訳(メタデータ) (2026-01-23T11:59:13Z) - CURENet: Combining Unified Representations for Efficient Chronic Disease Prediction [24.569877750738286]
CURENetは、構造化されていない臨床ノート、検査結果、患者の時系列データを統合するマルチモーダルモデルである。
CURENetは、さまざまな臨床データ間の複雑な相互作用を捉え、慢性疾患のより信頼性の高い予測モデルを作成することができる。
論文 参考訳(メタデータ) (2025-11-14T15:52:22Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - TACCO: Task-guided Co-clustering of Clinical Concepts and Patient Visits for Disease Subtyping based on EHR Data [42.96821770394798]
TACCOは、EMHデータのハイパーグラフモデリングに基づいて、臨床概念と患者訪問のクラスターを共同で発見する新しいフレームワークである。
我々は,表現型分類と心血管リスク予測の下流臨床課題に対して,公共MIMIC-IIIデータセットとエモリー内部CRADLEデータセットを用いて実験を行った。
深層モデル解析,クラスタリング結果解析,臨床ケーススタディは,TACCOが提供した改良されたユーティリティと洞察に富んだ解釈をさらに検証する。
論文 参考訳(メタデータ) (2024-06-14T14:18:38Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。