論文の概要: From Hazard Functions to Language Space: Cox-Supervised Distillation of Survival Risk into a Large Language Model
- arxiv url: http://arxiv.org/abs/2606.08945v1
- Date: Mon, 08 Jun 2026 02:47:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.582934
- Title: From Hazard Functions to Language Space: Cox-Supervised Distillation of Survival Risk into a Large Language Model
- Title(参考訳): ハザード関数から言語空間へ:Cox-Supervised Distillation of Survival Risk into a Large Language Model
- Authors: Nicholas I-Hsien Kuo, Blanca Gallego, Louisa Jorm,
- Abstract要約: 本研究では,時間-時間的リスクに関する情報を生成型大規模言語モデルに転送できるかどうかを検討する。
本稿では,テキストベースの生存モデルパイプラインを提案し,Qwenベースの大規模言語モデルを用いて患者固有の生存リスクを生成する。
- 参考スコア(独自算出の注目度): 0.7537475180985093
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We investigate whether information about time-to-event risk estimated by a Cox proportional hazards model can be transferred into a generative large language model. We propose a text-based survival modelling pipeline in which structured clinical covariates are converted into text prompts and a Qwen-based large language model is fine-tuned to generate patient-specific survival risk using Cox model predictions as a training target. Across GBSG2, ACTG320, and WHAS500, the model achieves competitive held-out discrimination and calibration despite being trained as a text-generation task rather than with a conventional survival-analysis loss. We further analyse the geometry of the model's hidden states, where t-SNE visualisations reveal smooth risk gradients in latent space, suggesting that the model represents survival risk as a continuous structure rather than isolated risk categories. Together, these findings suggest that large language models can internalise survival-risk structure while supporting calibrated prediction, providing a route towards time-to-event reasoning in language models.
- Abstract(参考訳): 本研究では,Cox比例ハザードモデルによって推定される時間-時間リスクに関する情報を,生成的大言語モデルに転送できるかどうかを検討する。
構造化された臨床共変体をテキストプロンプトに変換し、Qwenベースの大規模言語モデルを微調整し、Coxモデル予測をトレーニングターゲットとして、患者固有の生存リスクを生成するテキストベース生存モデルパイプラインを提案する。
GBSG2、ACTG320、WHAS500全体では、従来の生存分析損失よりもテキスト生成タスクとして訓練されているにもかかわらず、競争力のあるホールトアウト識別と校正を実現している。
さらに、t-SNE視覚化により潜在空間におけるスムーズなリスク勾配が明らかとなり、モデルが孤立したリスクカテゴリではなく、持続的な構造として生存リスクを表すことが示唆される。
これらの結果から,大規模言語モデルではキャリブレーション予測をサポートしながら生存リスク構造の内部化が可能であり,言語モデルにおける時間-時間推論への道筋が示唆された。
関連論文リスト
- Deep Survival Analysis for Competing Risk Modeling with Functional Covariates and Missing Data Imputation [13.108896747775063]
本稿では、競合リスク下での離散時間生存分析のための統合ディープラーニングフレームワークFCRNを紹介する。
関数データ表現のためのマイクロネットワークバス層と勾配ベースの計算モジュールを組み合わせることで、FCRNは、欠落した値をインプットし、イベント固有のハザードを予測することを同時に学習する。
論文 参考訳(メタデータ) (2025-09-29T18:33:00Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - CRISP-NAM: Competing Risks Interpretable Survival Prediction with Neural Additive Models [0.22940141855172033]
CRISP-NAMは、競合するリスクサバイバル分析のための解釈可能なニューラル加算モデルである。
各機能は、専用ニューラルネットワークによるリスク推定に独立して寄与する。
既存のアプローチと比較して,複数のデータセット上での競合性能を実証する。
論文 参考訳(メタデータ) (2025-05-27T15:52:15Z) - Uncertainty-Aware Decoding with Minimum Bayes Risk [70.6645260214115]
予測されたリスクに応じてモデル生成を選択する最小ベイズリスク復号法を,原理化された不確実性認識復号法に一般化する方法を示す。
この修正された予測リスクは、出力の選択と生成をいつ中止するかの判断の両方に有用であり、オーバーヘッドを発生させることなく改善を提供できることを示す。
論文 参考訳(メタデータ) (2025-03-07T10:55:12Z) - DPP-Based Adversarial Prompt Searching for Lanugage Models [56.73828162194457]
Auto-Regressive Selective Replacement Ascent (ASRA)は、決定点プロセス(DPP)と品質と類似性の両方に基づいてプロンプトを選択する離散最適化アルゴリズムである。
6種類の事前学習言語モデルに対する実験結果から,ASRAによる有害成分の抽出の有効性が示された。
論文 参考訳(メタデータ) (2024-03-01T05:28:06Z) - Interpretable Survival Analysis for Heart Failure Risk Prediction [50.64739292687567]
現状の生存モデルと解釈可能かつ競合する新しい生存分析パイプラインを提案する。
我々のパイプラインは最先端のパフォーマンスを達成し、心不全のリスク要因に関する興味深い新しい洞察を提供する。
論文 参考訳(メタデータ) (2023-10-24T02:56:05Z) - SurvLatent ODE : A Neural ODE based time-to-event model with competing
risks for longitudinal data improves cancer-associated Deep Vein Thrombosis
(DVT) prediction [68.8204255655161]
本稿では,不規則なサンプルデータの下で潜在表現をパラメータ化する生成時間対イベントモデルSurvLatent ODEを提案する。
そこで,本モデルでは,事象特異的ハザード関数の形状を指定せずに,複数の競合イベントの生存時間を柔軟に推定する。
SurvLatent ODEは、DVTリスクグループを成層化するために、現在の臨床標準であるKhorana Riskスコアより優れている。
論文 参考訳(メタデータ) (2022-04-20T17:28:08Z) - Surrogate Assisted Semi-supervised Inference for High Dimensional Risk
Prediction [3.10560974227074]
高次元予測器を用いたリスクモデリングのためのSAS(Surrogate Assisted Semi-supervised- Learning)アプローチを開発しています。
SAS法が高次元作業モデルに起因する予測リスクに対して有効な推論を提供することを実証する。
論文 参考訳(メタデータ) (2021-05-04T03:08:51Z) - DeepHazard: neural network for time-varying risks [0.6091702876917281]
生存予測のための新しいフレキシブルな手法,DeepHazardを提案する。
我々のアプローチは、時間内に添加物としてのみ制限される、広範囲の継続的なハザード形態に適合している。
数値的な例では,我々の手法は,C-インデックス計量を用いて評価された予測能力において,既存の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2020-07-26T21:01:49Z) - A General Framework for Survival Analysis and Multi-State Modelling [70.31153478610229]
ニューラル常微分方程式を多状態生存モデル推定のためのフレキシブルで一般的な方法として用いる。
また,本モデルでは,サバイバルデータセット上での最先端性能を示すとともに,マルチステート環境での有効性を示す。
論文 参考訳(メタデータ) (2020-06-08T19:24:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。