論文の概要: A novel language model for predicting serious adverse event results in clinical trials from their prospective registrations
- arxiv url: http://arxiv.org/abs/2507.22919v1
- Date: Mon, 21 Jul 2025 07:56:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-03 20:19:02.939566
- Title: A novel language model for predicting serious adverse event results in clinical trials from their prospective registrations
- Title(参考訳): 重症度予測のための新しい言語モデルによる臨床実験
- Authors: Qixuan Hu, Xumou Zhang, Jinman Kim, Florence Bourgeois, Adam G. Dunn,
- Abstract要約: 臨床治験における重篤な事象の予測法を,登録情報のみを用いて評価した。
今回,22,107本の腕の平行的介入型臨床試験をCricerTrials.govで実施し,構造的概要分析を行った。
- 参考スコア(独自算出の注目度): 8.134674449860668
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objectives: With accurate estimates of expected safety results, clinical trials could be designed to avoid terminations and limit exposing participants to unnecessary risks. We evaluated methods for predicting serious adverse event (SAE) results in clinical trials using information only from their registrations prior to the trial. Material and Methods: We analysed 22,107 two-arm parallel interventional clinical trials from ClinicalTrials.gov with structured summary results. Two prediction models were developed: a classifier predicting will experimental arm have higher SAE rates (area under the receiver operating characteristic curve; AUC) than control arm, and a regression model to predict the proportion of SAEs in control arms (root mean squared error; RMSE). A transfer learning approach using pretrained language models (e.g., ClinicalT5, BioBERT) was used for feature extraction, combined with downstream model for prediction. To maintain semantic representation in long trial texts exceeding localised language model input limits, a sliding window method was developed for embedding extraction. Results: The best model (ClinicalT5+Transformer+MLP) had 77.6% AUC predicting which trial arm has a higher proportion of patients with SAEs. When predicting proportion of participants experiencing SAE in the control arm, the same model achieved RMSE of 18.6%. The sliding window approach consistently outperformed methods without it. Across 12 classifiers, the average absolute AUC increase was 2.00%; across 12 regressors, the average absolute RMSE reduction was 1.58%. Discussion: Summary results data available at ClinicalTrials.gov remains underutilised. The potential to estimate results of trials before they start is an opportunity to improve trial design and flag discrepancies between expected and reported safety results.
- Abstract(参考訳): 目的: 予想される安全性結果の正確な推定により、臨床治験は終端を回避し、参加者を不必要なリスクに晒すことを制限するように設計されている。
臨床治験における重症事象 (SAE) の予測法について, 登録情報のみを用いて検討した。
材料と方法:22,107 両腕平行介入臨床試験をCricerTrials.gov から分析し,概説した。
2つの予測モデルが開発された: 実験アームが制御アームよりも高いSAEレート(受信機動作特性曲線下、AUC)、制御アーム内のSAEの割合を予測する回帰モデル(ルート平均2乗誤差、RMSE)。
特徴抽出には事前訓練された言語モデル(例えば、臨床T5、BioBERT)を用いた伝達学習手法と、予測には下流モデルが併用された。
局所言語モデル入力限界を超える長文のセマンティック表現を維持するために, 埋め込み抽出のためのスライディングウインドウ法を開発した。
結果: ベストモデル(ClinicalT5+Transformer+MLP)はAUCの77.6%で、どの治験腕がSAE患者の割合が高いかを予測している。
コントロールアームでSAEを経験する参加者の比率を予測すると、同じモデルがRMSEの18.6%を達成した。
スライディングウインドウのアプローチは、それなしでも一貫してメソッドのパフォーマンスが向上した。
12種中平均絶対AUC増加率は2.00%であり,12種中平均絶対RMSE減少率は1.58%であった。
議論: ClinicalTrials.govで利用可能なデータは未使用のままである。
試験開始前に試行の結果を見積もる能力は、試験設計の改善と、期待される結果と報告された安全結果との相違点を示す機会である。
関連論文リスト
- Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
予測型因果推論(PPCI)に焦点をあてる
PPCIは、未ラベルの事実結果を用いた対象実験における治療効果を推定し、事前訓練されたモデルからゼロショットを取得する。
バニラ実験的リスク最小化によって解決不可能なインスタンスに対するソリューションを提供するため,本手法を合成および実世界の科学的データに対して検証する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - SepsisLab: Early Sepsis Prediction with Uncertainty Quantification and Active Sensing [67.8991481023825]
セプシスは米国での院内死亡の主な原因である。
既存の予測モデルは通常、情報不足の少ない高品質なデータで訓練される。
限られた観察により信頼性の低い高リスク患者に対して,ロバストな能動センシングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-24T04:47:36Z) - Advanced Meta-Ensemble Machine Learning Models for Early and Accurate Sepsis Prediction to Improve Patient Outcomes [0.0]
本報告では, 全身性炎症性反応症候群, 早期警戒スコア, クイックシークエンシャル臓器不全評価など, 従来の敗血症スクリーニングツールの限界について検討する。
本稿では,機械学習技術 - ランダムフォレスト, エクストリームグラディエントブースティング, 決定木モデル - を用いて, セプシスの発症を予測することを提案する。
本研究は,これらのモデルについて,精度,精度,リコール,F1スコア,受信器動作特性曲線の下での領域といった重要な指標を用いて,個別かつ組み合わせたメタアンサンブルアプローチで評価する。
論文 参考訳(メタデータ) (2024-07-11T00:51:32Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Supervised Machine Learning for Breast Cancer Risk Factors Analysis and
Survival Prediction [0.5249805590164902]
最も効果的な治療法の選択は、最終的には乳がん生存予測に影響されるかもしれない。
本研究では,1904年の患者記録を用いて5年間の乳癌生存を機械学習を用いて予測した。
論文 参考訳(メタデータ) (2023-04-13T12:32:14Z) - SPOT: Sequential Predictive Modeling of Clinical Trial Outcome with
Meta-Learning [67.8195828626489]
臨床試験は薬物開発に不可欠であるが、時間を要する、費用がかかる、失敗する傾向がある。
本稿では,まず,複数ソースの臨床試験データを関連するトライアルトピックにクラスタリングするために,臨床トライアル結果の逐次予測mOdeling(SPOT)を提案する。
タスクとして各トライアルシーケンスを考慮して、メタ学習戦略を使用して、モデルが最小限のアップデートで新しいタスクに迅速に適応できるポイントを達成する。
論文 参考訳(メタデータ) (2023-04-07T23:04:27Z) - The Consequences of the Framing of Machine Learning Risk Prediction
Models: Evaluation of Sepsis in General Wards [0.0]
フレーミングがモデル性能とモデル学習に与える影響を4つの異なるアプローチで評価する。
デンマークの4自治体の221,283人の二次医療データを分析した。
論文 参考訳(メタデータ) (2021-01-26T14:00:05Z) - Bayesian prognostic covariate adjustment [59.75318183140857]
疾患の結果に関する歴史的データは、様々な方法で臨床試験の分析に組み込むことができる。
我々は, 予測モデルからの予後スコアを用いて, 治療効果推定の効率を向上する既存の文献に基づいて構築する。
論文 参考訳(メタデータ) (2020-12-24T05:19:03Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - A Knowledge Distillation Ensemble Framework for Predicting Short and
Long-term Hospitalisation Outcomes from Electronic Health Records Data [5.844828229178025]
既存の結果予測モデルは、頻繁なポジティブな結果の低いリコールに悩まされる。
我々は、死亡率とICUの受け入れによって表される逆さを自動的に予測する、高度にスケーリング可能な、堅牢な機械学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-18T15:56:28Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z) - Gradient Boosting on Decision Trees for Mortality Prediction in
Transcatheter Aortic Valve Implantation [5.050648346154715]
心臓外科における現在の予後リスクスコアは統計に基づいており、まだ機械学習の恩恵を受けていない。
本研究は,TAVI後の患者の1年間の死亡率を予測する機械学習モデルの構築を目的とする。
論文 参考訳(メタデータ) (2020-01-08T10:04:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。