論文の概要: Early Risk Stratification of Dosing Errors in Clinical Trials Using Machine Learning
- arxiv url: http://arxiv.org/abs/2602.22285v1
- Date: Wed, 25 Feb 2026 13:29:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.353515
- Title: Early Risk Stratification of Dosing Errors in Clinical Trials Using Machine Learning
- Title(参考訳): 機械学習を用いた臨床試験におけるドッキングエラーの早期リスク階層化
- Authors: Félicien Hêche, Sohrab Ferdowsi, Anthony Yazdani, Sara Sansaloni-Pastor, Douglas Teodoro,
- Abstract要約: 本研究の目的は、臨床試験の早期リスク階層化のための機械学習(ML)ベースのフレームワークを開発することである。
臨床Trials.govから42,112個のCT画像からなるデータセットを構築した。
CTは, 有害事象報告, MedDRA用語, Wilson自信区間から得られた高線量誤差率を示す2値ラベルを付与した。
- 参考スコア(独自算出の注目度): 1.626552847072743
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: The objective of this study is to develop a machine learning (ML)-based framework for early risk stratification of clinical trials (CTs) according to their likelihood of exhibiting a high rate of dosing errors, using information available prior to trial initiation. Materials and Methods: We constructed a dataset from ClinicalTrials.gov comprising 42,112 CTs. Structured, semi-structured trial data, and unstructured protocol-related free-text data were extracted. CTs were assigned binary labels indicating elevated dosing error rate, derived from adverse event reports, MedDRA terminology, and Wilson confidence intervals. We evaluated an XGBoost model trained on structured features, a ClinicalModernBERT model using textual data, and a simple late-fusion model combining both modalities. Post-hoc probability calibration was applied to enable interpretable, trial-level risk stratification. Results: The late-fusion model achieved the highest AUC-ROC (0.862). Beyond discrimination, calibrated outputs enabled robust stratification of CTs into predefined risk categories. The proportion of trials labeled as having an excessively high dosing error rate increased monotonically across higher predicted risk groups and aligned with the corresponding predicted probability ranges. Discussion: These findings indicate that dosing error risk can be anticipated at the trial level using pre-initiation information. Probability calibration was essential for translating model outputs into reliable and interpretable risk categories, while simple multimodal integration yielded performance gains without requiring complex architectures. Conclusion: This study introduces a reproducible and scalable ML framework for early, trial-level risk stratification of CTs at risk of high dosing error rates, supporting proactive, risk-based quality management in clinical research.
- Abstract(参考訳): 目的: 本研究の目的は, 臨床試験開始前に利用可能な情報を用いて, 高率の投薬誤差を示す可能性に応じて, 早期の臨床試験(CT)のリスク階層化を目的とした機械学習(ML)ベースのフレームワークを開発することである。
材料と方法:42,112個のCT画像からなるCricerTrials.govからデータセットを構築した。
構造化半構造化試験データと非構造化プロトコル関連自由テキストデータを抽出した。
CTは, 有害事象報告, MedDRA用語, Wilson自信区間から得られた高線量誤差率を示す2値ラベルを付与した。
我々は、構造化特徴を訓練したXGBoostモデル、テキストデータを用いた臨床ModernBERTモデル、および両モードを組み合わせた単純なレイトフュージョンモデルを評価した。
解釈可能な, 試行レベルのリスク層化を可能にするために, ポストホック確率キャリブレーションを適用した。
結果: 後期核融合モデルが最も高いAUC-ROC(0.862。
識別以外にも、校正された出力はCTを事前に定義されたリスクカテゴリに頑健な成層化を可能にした。
過剰に高用量エラー率を有するとラベル付けされた試験の割合は、高い予測リスク群で単調に増加し、対応する予測確率範囲と一致した。
考察: これらの結果から, 試行錯誤リスクは, 開始前情報を用いて予測できることが示唆された。
モデル出力を信頼性と解釈可能なリスクカテゴリに変換する上では,確率キャリブレーションが不可欠であった。
結論: 本研究は,CTの早期かつ試行レベルのリスク階層化のための再現可能かつスケーラブルなMLフレームワークを導入し, 臨床研究における積極的, リスクベースの品質管理を支援する。
関連論文リスト
- Overlap-weighted orthogonal meta-learner for treatment effect estimation over time [90.46786193198744]
ヘテロジニアス治療効果(HTE)を推定するための新しい重み付きメタラーナーを提案する。
我々のWO-Larnerは、ノイマン直交性(Neyman-orthogonality)の好ましい性質を持ち、ニュアンス関数の誤特定に対して堅牢である。
我々のWO-learnerは完全にモデルに依存しず、あらゆる機械学習モデルに適用可能であることを示す。
論文 参考訳(メタデータ) (2025-10-22T14:47:57Z) - Deep Survival Analysis for Competing Risk Modeling with Functional Covariates and Missing Data Imputation [13.108896747775063]
本稿では、競合リスク下での離散時間生存分析のための統合ディープラーニングフレームワークFCRNを紹介する。
関数データ表現のためのマイクロネットワークバス層と勾配ベースの計算モジュールを組み合わせることで、FCRNは、欠落した値をインプットし、イベント固有のハザードを予測することを同時に学習する。
論文 参考訳(メタデータ) (2025-09-29T18:33:00Z) - LLM-Augmented Symptom Analysis for Cardiovascular Disease Risk Prediction: A Clinical NLP [2.2615384250361004]
本研究は, 症状抽出, 文脈推論, 自由テキストレポートからの相関に, ドメイン適応型大言語モデルを用いた, 新規なLLM拡張臨床NLPパイプラインを提案する。
MIMIC-IIIおよびCARDIO-NLPデータセットの評価は、精度、リコール、F1スコア、AUROCにおいて高い臨床関連性を示した。
論文 参考訳(メタデータ) (2025-07-15T07:32:16Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Prediction-Powered Causal Inferences [59.98498488132307]
予測型因果推論(PPCI)に焦点をあてる
まず, 条件付きキャリブレーションにより, 人口レベルでの有効なPPCIが保証されることを示す。
次に、実験間での十分な表現制約伝達の妥当性を導入する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
この設定では、一般化されたクロスバリデーション推定器(GCV)がサンプル外リスクを正確に予測できないことを示す。
さらに、テストポイントがトレーニングセットと非自明な相関を持つ場合、時系列予測でしばしば発生する設定にまで分析を拡張します。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Modeling Long Sequences in Bladder Cancer Recurrence: A Comparative Evaluation of LSTM,Transformer,and Mamba [0.0]
本研究では,Cox比例ハザードモデルを用いて,時系列データを扱う深層学習モデルの利点を統合する。
LSTM-Coxモデルは、TransformerやMambaといった新しいモデルにまたがる、リカレントなデータ解析と特徴抽出のための堅牢で効率的な方法である。
論文 参考訳(メタデータ) (2024-05-28T18:38:15Z) - A Generalized Unbiased Risk Estimator for Learning with Augmented
Classes [70.20752731393938]
ラベルなしのデータが与えられた場合、非バイアスリスク推定器(URE)が導出され、理論的保証のあるLACでは最小限にすることができる。
理論的な保証を維持しつつ任意の損失関数を装備できる一般化されたUREを提案する。
論文 参考訳(メタデータ) (2023-06-12T06:52:04Z) - SurvLatent ODE : A Neural ODE based time-to-event model with competing
risks for longitudinal data improves cancer-associated Deep Vein Thrombosis
(DVT) prediction [68.8204255655161]
本稿では,不規則なサンプルデータの下で潜在表現をパラメータ化する生成時間対イベントモデルSurvLatent ODEを提案する。
そこで,本モデルでは,事象特異的ハザード関数の形状を指定せずに,複数の競合イベントの生存時間を柔軟に推定する。
SurvLatent ODEは、DVTリスクグループを成層化するために、現在の臨床標準であるKhorana Riskスコアより優れている。
論文 参考訳(メタデータ) (2022-04-20T17:28:08Z) - A New Approach for Interpretability and Reliability in Clinical Risk
Prediction: Acute Coronary Syndrome Scenario [0.33927193323747895]
我々は、リスクスコアと機械学習モデルの両方の最高の特徴を組み合わせた、新たなリスクアセスメント方法論を作成するつもりです。
提案手法は、標準LRと同一の試験結果を得たが、より優れた解釈性とパーソナライゼーションを提供する。
個人予測の信頼性推定は誤分類率と大きな相関を示した。
論文 参考訳(メタデータ) (2021-10-15T19:33:46Z) - Active Deep Learning on Entity Resolution by Risk Sampling [5.219701379581547]
アクティブラーニング(al)は、モデルトレーニングに有用なデータに焦点を当てた、実現可能なソリューションである。
実体解決のためのリスクサンプリング(ER)の新たなALアプローチを提案する。
ALのコアセット特性に基づいて、非一様連続性によるコアセット損失を最小限に抑える最適化モデルを理論的に導出する。
実データに対する提案手法の有効性を比較検討により実証的に検証した。
論文 参考訳(メタデータ) (2020-12-23T20:38:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。