論文の概要: Predicting Post-Traumatic Epilepsy from Clinical Records using Large Language Model Embeddings
- arxiv url: http://arxiv.org/abs/2604.14547v1
- Date: Thu, 16 Apr 2026 02:24:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.683568
- Title: Predicting Post-Traumatic Epilepsy from Clinical Records using Large Language Model Embeddings
- Title(参考訳): 大規模言語モデル埋め込みを用いた外傷後てんかんの予測
- Authors: Wenhui Cui, Nicholas Swingle, Anand A. Joshi, Dileep Nair, Richard M. Leahy,
- Abstract要約: 外傷後てんかん(PTE)は外傷性脳損傷(TBI)後に発症する神経疾患である
臨床記録を符号化する固定特徴抽出器として,事前訓練された大言語モデル(LLM)を実装した自動PTE予測フレームワークを開発した。
- 参考スコア(独自算出の注目度): 1.5481419663066267
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: Post-traumatic epilepsy (PTE) is a debilitating neurological disorder that develops after traumatic brain injury (TBI). Early prediction of PTE remains challenging due to heterogeneous clinical data, limited positive cases, and reliance on resource-intensive neuroimaging data. We investigate whether routinely collected acute clinical records alone can support early PTE prediction using language model-based approaches. Methods: Using a curated subset of the TRACK-TBI cohort, we developed an automated PTE prediction framework that implements pretrained large language models (LLMs) as fixed feature extractors to encode clinical records. Tabular features, LLM-generated embeddings, and hybrid feature representations were evaluated using gradient-boosted tree classifiers under stratified cross-validation. Results: LLM embeddings achieved performance improvements by capturing contextual clinical information compared to using tabular features alone. The best performance was achieved by a modality-aware feature fusion strategy combining tabular features and LLM embeddings, achieving an AUC-ROC of 0.892 and AUPRC of 0.798. Acute post-traumatic seizures, injury severity, neurosurgical intervention, and ICU stay are key contributors to the predictive performance. Significance: These findings demonstrate that routine acute clinical records contain information suitable for early PTE risk prediction using LLM embeddings in conjunction with gradient-boosted tree classifiers. This approach represents a promising complement to imaging-based prediction.
- Abstract(参考訳): 目的:外傷後てんかん(PTE)は外傷性脳損傷(TBI)後に発症する神経疾患である。
PTEの早期予測は、異種の臨床データ、限られた陽性例、リソース集約型神経画像データに依存するため、依然として困難である。
言語モデルを用いた早期PTE予測を,日常的に収集した急性期臨床記録だけで支援できるかどうかを検討する。
方法:TRACK-TBIコホートのキュレートされたサブセットを用いて,臨床記録を符号化するための固定特徴抽出器として,事前訓練された大言語モデル(LLM)を実装した自動PTE予測フレームワークを開発した。
階層化クロスバリデーション下の木分類器を用いて, タブラル特徴, LLM生成埋め込み, ハイブリッド特徴表現の評価を行った。
結果: LLM埋め込みは, 表状特徴のみを用いた場合と比較して, 文脈的臨床情報を取り込み, 性能改善を実現した。
最高の性能は、タブ状特徴とLLM埋め込みを組み合わせたモダリティ対応機能融合戦略により達成され、AUC-ROCは0.892、AUPRCは0.798である。
急性外傷後発作、重度の外傷、神経外科的介入、ICUの滞在は、予測性能の重要な要因である。
意義: これらの結果から, 早期PTEリスク予測に適した情報を含む急性期臨床記録は, LLM埋め込みと勾配型木分類器の併用が示唆された。
このアプローチは、画像ベースの予測に対する有望な補完である。
関連論文リスト
- PREBA: Surgical Duration Prediction via PCA-Weighted Retrieval-Augmented LLMs and Bayesian Averaging Aggregation [51.96735866702332]
PreBAはPCA重み付き検索とベイズ平均アグリゲーションを統合した検索拡張フレームワークである。
例えば、PreBAはパフォーマンスを大幅に改善し、MAEを最大40%削減し、ゼロショット推論でR2を-0.13から0.62に引き上げる。
論文 参考訳(メタデータ) (2026-02-27T07:19:23Z) - Investigating the Impact of Histopathological Foundation Models on Regressive Prediction of Homologous Recombination Deficiency [52.50039435394964]
回帰に基づくタスクの基礎モデルを体系的に評価する。
我々は5つの最先端基礎モデルを用いて、スライド画像全体(WSI)からパッチレベルの特徴を抽出する。
乳房、子宮内膜、肺がんコホートにまたがるこれらの抽出された特徴に基づいて、連続したRDDスコアを予測するモデルが訓練されている。
論文 参考訳(メタデータ) (2026-01-29T14:06:50Z) - SurgeryLSTM: A Time-Aware Neural Model for Accurate and Explainable Length of Stay Prediction After Spine Surgery [44.119171920037196]
選択的脊椎手術における滞在時間(LOS)予測のための機械学習モデルの開発と評価を行った。
我々は,従来のMLモデルと,マスク付き双方向長短期記憶(BiLSTM)であるオペレーショナルLSTMを比較した。
決定係数(R2)を用いて性能を評価し,説明可能なAIを用いて鍵予測器を同定した。
論文 参考訳(メタデータ) (2025-07-15T01:18:28Z) - AUTOCT: Automating Interpretable Clinical Trial Prediction with LLM Agents [47.640779069547534]
AutoCTは、大規模言語モデルの推論能力と古典的な機械学習の説明可能性を組み合わせた、新しいフレームワークである。
臨床治験予測タスクにおいて, AutoCT は SOTA 法と同等以上の性能を示した。
論文 参考訳(メタデータ) (2025-06-04T11:50:55Z) - CLaDMoP: Learning Transferrable Models from Successful Clinical Trials via LLMs [14.116060944536011]
CLaDMoPは,臨床治験結果予測のための新しい事前学習手法である。
CLaDMoPは、新しい多層核融合技術により、試験の適性基準を軽量な薬物分子分岐にリンクする。
CLaDMoPはPR-AUCを最大10.5%改善し、OC-AUCを3.6%改善し、MEXA-CTPに匹敵するF1スコアを得た。
論文 参考訳(メタデータ) (2025-05-24T05:45:32Z) - Early Diagnosis of Atrial Fibrillation Recurrence: A Large Tabular Model Approach with Structured and Unstructured Clinical Data [0.0]
本研究は, 従来の臨床成績, MLモデル, LTM アプローチを用いて, 術後1カ月から2年後のAF再発を予測することを目的としている。
論文 参考訳(メタデータ) (2025-05-20T17:31:05Z) - Enhancing In-Hospital Mortality Prediction Using Multi-Representational Learning with LLM-Generated Expert Summaries [3.5508427067904864]
ICU患者の院内死亡率(IHM)予測は、時間的介入と効率的な資源配分に重要である。
本研究は、構造化された生理データと臨床ノートをLarge Language Model(LLM)によって生成された専門家要約と統合し、IHM予測精度を向上させる。
論文 参考訳(メタデータ) (2024-11-25T16:36:38Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。