論文の概要: TimeTox: An LLM-Based Pipeline for Automated Extraction of Time Toxicity from Clinical Trial Protocols
- arxiv url: http://arxiv.org/abs/2603.21335v2
- Date: Tue, 24 Mar 2026 02:56:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 12:42:17.600903
- Title: TimeTox: An LLM-Based Pipeline for Automated Extraction of Time Toxicity from Clinical Trial Protocols
- Title(参考訳): TimeTox:臨床試験プロトコルからの時間毒性の自動抽出のためのLCMベースのパイプライン
- Authors: Saketh Vinjamuri, Marielle Fis Loperena, Marie C. Spezia, Ramez Kouzy,
- Abstract要約: 時間毒性(英: Time toxicity)とは、臨床治験への参加から生じる累積的な医療接触日であり、重要なが労働集約的な指標である。
We developed TimeTox, a LLM-based pipeline for automated extract of time toxicity from Schedule of Assessments table。
- 参考スコア(独自算出の注目度): 0.26999000177990923
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Time toxicity, the cumulative healthcare contact days from clinical trial participation, is an important but labor-intensive metric to extract from protocol documents. We developed TimeTox, an LLM-based pipeline for automated extraction of time toxicity from Schedule of Assessments tables. TimeTox uses Google's Gemini models in three stages: summary extraction from full-length protocol PDFs, time toxicity quantification at six cumulative timepoints for each treatment arm, and multi-run consensus via position-based arm matching. We validated against 20 synthetic schedules (240 comparisons) and assessed reproducibility on 644 real-world oncology protocols. Two architectures were compared: single-pass (vanilla) and two-stage (structure-then-count). The two-stage pipeline achieved 100% clinically acceptable accuracy ($\pm$3 days) on synthetic data (MAE 0.81 days) versus 41.5% for vanilla (MAE 9.0 days). However, on real-world protocols, the vanilla pipeline showed superior reproducibility: 95.3% clinically acceptable accuracy (IQR $\leq$ 3 days) across 3 runs on 644 protocols, with 82.0% perfect stability (IQR = 0). The production pipeline extracted time toxicity for 1,288 treatment arms across multiple disease sites. Extraction stability on real-world data, rather than accuracy on synthetic benchmarks, is the decisive factor for production LLM deployment.
- Abstract(参考訳): 時間毒性(英: Time toxicity)とは、臨床試験に参加することによる累積的な医療接触日であり、プロトコル文書から抽出する上で重要なが労働集約的な指標である。
We developed TimeTox, a LLM-based pipeline for automated extract of time toxicity from Schedule of Assessments table。
TimeToxでは、フル長のプロトコルPDFからの要約抽出、各治療アームの6つの累積タイムポイントでの時間毒性定量化、位置ベースのアームマッチングによるマルチランコンセンサスという3つのステージでGoogleのGeminiモデルを使用している。
実世界の644のオンコロジープロトコル上で, 合成スケジュール20件(240の比較)と再現性の評価を行った。
シングルパス(バニラ)と2ステージ(構造単位)の2つのアーキテクチャを比較した。
2段階のパイプラインは、合成データ(MAE 0.81日)に対して100%臨床的に許容できる精度(\pm$3日)を達成し、バニラでは41.5%(MAE 9.0日)を達成した。
95.3%の精度(IQR $\leq$3日)が644のプロトコルで動作し、82.0%の安定性(IQR = 0)である。
製造パイプラインは、複数の疾患部位にまたがる1,288個の治療用アームの時間毒性を抽出した。
実世界のデータの抽出安定性は、合成ベンチマークの精度よりもむしろ、LLMの量産における決定的な要素である。
関連論文リスト
- PanCanBench: A Comprehensive Benchmark for Evaluating Large Language Models in Pancreatic Oncology [48.732366302949515]
大規模言語モデル(LLM)は、標準化された検査において専門家レベルの性能を達成したが、複数の選択精度は現実の臨床的有用性や安全性を十分に反映していない。
我々は、未確認患者の質問に対して、専門家のルーブリックを作成するための、ループ内人間パイプラインを開発した。
LLM-as-a-judge フレームワークを用いて,22のプロプライエタリおよびオープンソース LLM の評価を行い,臨床完全性,事実精度,Web-search 統合について検討した。
論文 参考訳(メタデータ) (2026-03-02T00:50:39Z) - LiveClin: A Live Clinical Benchmark without Leakage [50.45415584327275]
LiveClinは、実際の臨床実践を近似するために設計されたライブベンチマークである。
本研究は,患者を臨床経過全体にわたる複雑なマルチモーダルな評価シナリオに転換する。
LiveClin上で26のモデルを評価すると、これらの実世界のシナリオの難しさが明らかとなり、最高性能のモデルではケース精度が35.7%に達した。
論文 参考訳(メタデータ) (2026-02-18T03:59:46Z) - Bridging the Compression-Precision Paradox: A Hybrid Architecture for Clinical EEG Report Generation with Guaranteed Measurement Accuracy [2.904501695585514]
自動脳波モニタリングは、発作の検出と報告のために臨床レベルの精度を必要とする。
臨床脳波記録はLLMコンテキストウインドウを超え、極度の圧縮(400:1以上の比率)を必要とするため、微細な時間的精度を損なう。
脳波自動診断における臨床測定精度を保証する最初のシステムである。
論文 参考訳(メタデータ) (2026-02-11T05:36:14Z) - Transparent Early ICU Mortality Prediction with Clinical Transformer and Per-Case Modality Attribution [42.85462513661566]
ICU滞在後48時間から, 生理的時系列測定と非構造的臨床記録とを融合した, 軽量で透明なマルチモーダルアンサンブルを提案する。
ロジスティック回帰モデルは、バイタル用双方向LSTMとノート用微調整された臨床ModernBERT変換器の2つのモード固有モデルからの予測を組み合わせる。
MIMIC-IIIベンチマークでは、遅延融合アンサンブルは、よく校正された予測を維持しながら、最高の単一モデルに対する差別を改善する。
論文 参考訳(メタデータ) (2025-11-19T20:11:49Z) - Machine Generalize Learning in Agent-Based Models: Going Beyond Surrogate Models for Calibration in ABMs [0.0]
キャリブレーションエージェントベースの疫病モデルは、計算的に要求されている。
本稿では,流行時系列からSIRパラメータへの逆写像を学習する教師付き機械学習校正器を提案する。
論文 参考訳(メタデータ) (2025-09-06T18:28:00Z) - PMOA-TTS: Introducing the PubMed Open Access Textual Times Series Corpus [9.924632472835551]
PMOA-TTSは124,699の注釈付きPubMed Open Accessケースレポートの最初の公開データセットである。
Llama 3.3にフィルターを併用し, 単発症例の報告を同定し, 即時抽出を行った。
タイムラインの質を評価するために,3つの指標を用いてクリニカル・カレード・リファレンス・セットに対して評価を行った。
論文 参考訳(メタデータ) (2025-05-23T18:01:09Z) - Reconstructing Sepsis Trajectories from Clinical Case Reports using LLMs: the Textual Time Series Corpus for Sepsis [7.734726150561087]
臨床症例報告と退院サマリーは、患者遭遇の最も完全かつ正確な要約であり得るが、それらは最終的、すなわち、遭遇後のタイムスタンプである。
我々は,大規模言語モデルを用いた症例報告において,時間的局所的な発見を表現し,抽出し,注釈するパイプラインを構築した。
論文 参考訳(メタデータ) (2025-04-12T03:07:44Z) - Comparing Hyper-optimized Machine Learning Models for Predicting Efficiency Degradation in Organic Solar Cells [38.647921189039934]
本研究は,有機太陽電池 (OSC) の電力変換効率 (PCE) に苦しむ時間的劣化を表現するための機械学習モデルを提案する。
製造プロセスと環境条件の両方に関して最大7変数を含む996項目のデータベースを180日間以上作成しました。
一方、根平均二乗誤差(RMSE)、二乗誤差(SSE)の和、および平均絶対誤差(MAE)>1%の目標値であるPCEは、係数決定(R2)の値に達した。
論文 参考訳(メタデータ) (2024-03-29T22:05:26Z) - Clinical Temporal Relation Extraction with Probabilistic Soft Logic
Regularization and Global Inference [50.029659413650194]
既存のメソッドは、高価な機能エンジニアリングを必要とするか、イベント間のグローバルな依存関係をモデル化できない。
本稿では,確率論的ソフト論理規則化とグローバル推論を用いた新しい臨床時間緩和法を提案する。
論文 参考訳(メタデータ) (2020-12-16T08:23:03Z) - Rainfall-Runoff Prediction at Multiple Timescales with a Single Long
Short-Term Memory Network [41.33870234564485]
長期記憶ネットワーク(Long Short-Term Memory Networks, LSTMs)は, 日常の放電予測に顕著な成功を収めている。
しかし、多くの現実的なシナリオはより粒度の細かい時間スケールで予測を必要とする。
本研究では,一つのモデル内で複数の時間スケールを共同で予測する2つのMulti-Timescale LSTMアーキテクチャを提案する。
これらのモデルを米国大陸の516の流域でテストし、米国水モデルに対するベンチマークを行った。
論文 参考訳(メタデータ) (2020-10-15T17:52:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。