論文の概要: CLaDMoP: Learning Transferrable Models from Successful Clinical Trials via LLMs
- arxiv url: http://arxiv.org/abs/2505.18527v1
- Date: Sat, 24 May 2025 05:45:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.480192
- Title: CLaDMoP: Learning Transferrable Models from Successful Clinical Trials via LLMs
- Title(参考訳): CLaDMoP: LLMを用いた臨床実験からトランスファー可能なモデルを学ぶ
- Authors: Yiqing Zhang, Xiaozhong Liu, Fabricio Murai,
- Abstract要約: CLaDMoPは,臨床治験結果予測のための新しい事前学習手法である。
CLaDMoPは、新しい多層核融合技術により、試験の適性基準を軽量な薬物分子分岐にリンクする。
CLaDMoPはPR-AUCを最大10.5%改善し、OC-AUCを3.6%改善し、MEXA-CTPに匹敵するF1スコアを得た。
- 参考スコア(独自算出の注目度): 14.116060944536011
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many existing models for clinical trial outcome prediction are optimized using task-specific loss functions on trial phase-specific data. While this scheme may boost prediction for common diseases and drugs, it can hinder learning of generalizable representations, leading to more false positives/negatives. To address this limitation, we introduce CLaDMoP, a new pre-training approach for clinical trial outcome prediction, alongside the Successful Clinical Trials dataset(SCT), specifically designed for this task. CLaDMoP leverages a Large Language Model-to encode trials' eligibility criteria-linked to a lightweight Drug-Molecule branch through a novel multi-level fusion technique. To efficiently fuse long embeddings across levels, we incorporate a grouping block, drastically reducing computational overhead. CLaDMoP avoids reliance on task-specific objectives by pre-training on a "pair matching" proxy task. Compared to established zero-shot and few-shot baselines, our method significantly improves both PR-AUC and ROC-AUC, especially for phase I and phase II trials. We further evaluate and perform ablation on CLaDMoP after Parameter-Efficient Fine-Tuning, comparing it to state-of-the-art supervised baselines, including MEXA-CTP, on the Trial Outcome Prediction(TOP) benchmark. CLaDMoP achieves up to 10.5% improvement in PR-AUC and 3.6% in ROC-AUC, while attaining comparable F1 score to MEXA-CTP, highlighting its potential for clinical trial outcome prediction. Code and SCT dataset can be downloaded from https://github.com/murai-lab/CLaDMoP.
- Abstract(参考訳): 臨床試験結果予測のための既存のモデルの多くは、試験段階別データに基づいてタスク固有損失関数を用いて最適化されている。
このスキームは、一般的な疾患や薬物の予測を促進する可能性があるが、一般化可能な表現の学習を妨げ、より多くの偽陽性/陰性を引き起こす。
この制限に対処するために,本課題に特化して設計された臨床治験データセット(SCT)とともに,臨床治験結果予測のための新たな事前学習手法であるCLaDMoPを導入する。
CLaDMoPは、トライアルの適性基準を、新しいマルチレベル融合技術を通じて軽量なドラッグ・分子ブランチにリンクさせるために、Large Language Model-code を利用する。
階層の長い埋め込みを効率よく融合させるため,グループ化ブロックを導入し,計算オーバーヘッドを大幅に削減した。
CLaDMoPは、"ペアマッチング"プロキシタスクを事前トレーニングすることで、タスク固有の目的への依存を避ける。
確立されたゼロショットベースラインと少数ショットベースラインと比較して,本手法はPR-AUCとROC-AUCの両方,特に第I相および第II相の試験において有意に改善する。
さらに,パラメータ効率の良いファインチューニング後のCLaDMoPのアブレーションを,MEXA-CTPを含む最先端の教師付きベースラインと比較し,試行アウトカム予測(TOP)ベンチマークで検討した。
CLaDMoPは、PR-AUCが最大10.5%改善し、ROC-AUCが3.6%向上し、MEXA-CTPに匹敵するF1スコアを得た。
コードとSCTデータセットはhttps://github.com/murai-lab/CLaDMoPからダウンロードできる。
関連論文リスト
- MEXA-CTP: Mode Experts Cross-Attention for Clinical Trial Outcome Prediction [14.116060944536011]
我々は、容易に利用可能なマルチモーダルデータを統合し、効果的な表現を生成する軽量アテンションベースモデルMEXA-CTPを提案する。
実験の結果,MEXA-CTPはF1スコアで11.3%,PR-AUCで12.2%,ROC-AUCで2.5%向上した。
論文 参考訳(メタデータ) (2025-01-12T14:35:31Z) - Scaling Laws for Predicting Downstream Performance in LLMs [75.28559015477137]
この研究は、性能推定のためのより計算効率のよい指標として、事前学習損失に焦点を当てている。
FLP-Mは、事前トレーニング中に複数のソースからのデータセットを統合する実践的なニーズに対処する、パフォーマンス予測の基本的なアプローチである。
論文 参考訳(メタデータ) (2024-10-11T04:57:48Z) - Early Prediction of Causes (not Effects) in Healthcare by Long-Term Clinical Time Series Forecasting [11.96384267146423]
臨床変数の時系列予測(TSF)により原因を直接予測することを提案する。
モデルトレーニングは特定のラベルに依存しないため、予測されたデータはコンセンサスベースのラベルを予測するために使用できる。
論文 参考訳(メタデータ) (2024-08-07T14:52:06Z) - An Efficient and Flexible Deep Learning Method for Signal Delineation via Keypoints Estimation [4.2807943283312095]
本稿では,キーポイント推定のための新しいDLモデルであるKEED(Keypoint Estimation for Electrocardiogram Delineation)を提案する。
KEEDは、臨床的な期待に沿ったアウトプットを有機的に提供する。
注目すべきは、非常に限定的な注釈付きデータで最適化されているにもかかわらず、KEEDは大幅にパフォーマンスが向上していることだ。
論文 参考訳(メタデータ) (2024-07-24T08:13:10Z) - Hyperparameters in Continual Learning: A Reality Check [53.30082523545212]
連続学習(CL)は、可塑性(新しいタスクを学ぶ)と安定性(事前知識を保持する)のトレードオフをバランスしながら、一連のタスクでモデルを訓練することを目的としている。
論文 参考訳(メタデータ) (2024-03-14T03:13:01Z) - SECRETS: Subject-Efficient Clinical Randomized Controlled Trials using
Synthetic Intervention [0.0]
クロスオーバー試験は、個人ごとの処理効果を測定することで、サンプルサイズの要求を減らすことができる。
外部データを用いることなく, 患者ごとの個別治療効果(ITE)を推定する新しいフレームワークであるSECRETSを提案する。
この結果から,SECRETSはRCTのパワーを向上しつつ,同等の意義レベルを維持することができることがわかった。
論文 参考訳(メタデータ) (2023-05-08T22:37:16Z) - SPOT: Sequential Predictive Modeling of Clinical Trial Outcome with
Meta-Learning [67.8195828626489]
臨床試験は薬物開発に不可欠であるが、時間を要する、費用がかかる、失敗する傾向がある。
本稿では,まず,複数ソースの臨床試験データを関連するトライアルトピックにクラスタリングするために,臨床トライアル結果の逐次予測mOdeling(SPOT)を提案する。
タスクとして各トライアルシーケンスを考慮して、メタ学習戦略を使用して、モデルが最小限のアップデートで新しいタスクに迅速に適応できるポイントを達成する。
論文 参考訳(メタデータ) (2023-04-07T23:04:27Z) - Robust and Agnostic Learning of Conditional Distributional Treatment
Effects [62.44901952244514]
条件平均治療効果(CATE)は、個々の因果効果の最適点予測である。
集約分析では、通常は分布処理効果(DTE)の測定によって対処される。
我々は,多種多様な問題に対して条件付きDTE(CDTE)を学習するための,新しい堅牢でモデルに依存しない手法を提供する。
論文 参考訳(メタデータ) (2022-05-23T17:40:31Z) - Bayesian prognostic covariate adjustment [59.75318183140857]
疾患の結果に関する歴史的データは、様々な方法で臨床試験の分析に組み込むことができる。
我々は, 予測モデルからの予後スコアを用いて, 治療効果推定の効率を向上する既存の文献に基づいて構築する。
論文 参考訳(メタデータ) (2020-12-24T05:19:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。