論文の概要: Automated Detection of Dosing Errors in Clinical Trial Narratives: A Multi-Modal Feature Engineering Approach with LightGBM
- arxiv url: http://arxiv.org/abs/2604.19759v1
- Date: Wed, 25 Mar 2026 14:56:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.051694
- Title: Automated Detection of Dosing Errors in Clinical Trial Narratives: A Multi-Modal Feature Engineering Approach with LightGBM
- Title(参考訳): 臨床実験における線量誤差の自動検出:LightGBMを用いた多モード特徴工学的アプローチ
- Authors: Mohammad AL-Smadi,
- Abstract要約: 本研究では,非構造的臨床試験におけるドスリングエラーの自動検出システムを提案する。
提案手法は,従来のNLP(TF-IDF,キャラクタn-gram),密接なセマンティック埋め込み,ドメイン固有の医療パターン,トランスフォーマーベースのスコアにまたがる3,451の特徴を組み合わせたものである。
- 参考スコア(独自算出の注目度): 1.0152838128195467
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Clinical trials require strict adherence to medication protocols, yet dosing errors remain a persistent challenge affecting patient safety and trial integrity. We present an automated system for detecting dosing errors in unstructured clinical trial narratives using gradient boosting with comprehensive multi-modal feature engineering. Our approach combines 3,451 features spanning traditional NLP (TF-IDF, character n-grams), dense semantic embeddings (all-MiniLM-L6v2), domain-specific medical patterns, and transformer-based scores (BiomedBERT, DeBERTa-v3), used to train a LightGBM model. Features are extracted from nine complementary text fields (median 5,400 characters per sample) ensuring complete coverage across all 42,112 clinical trial narratives. On the CT-DEB benchmark dataset with severe class imbalance (4.9% positive rate), we achieve 0.8725 test ROC-AUC through 5-fold ensemble averaging (cross-validation: 0.8833 + 0.0091 AUC). Systematic ablation studies reveal that removing sentence embeddings causes the largest performance degradation (2.39%), demonstrating their critical role despite contributing only 37.07% of total feature importance. Feature efficiency analysis demonstrates that selecting the top 500-1000 features yields optimal performance (0.886-0.887 AUC), outperforming the full 3,451-feature set (0.879 AUC) through effective noise reduction. Our findings highlight the importance of feature selection as a regularization technique and demonstrate that sparse lexical features remain complementary to dense representations for specialized clinical text classification under severe class imbalance.
- Abstract(参考訳): 臨床試験では、薬のプロトコルに厳格に準拠する必要があるが、服用エラーは患者の安全性と治験の整合性に影響を与える永続的な課題である。
包括的マルチモーダル特徴工学を用いたグラデーションブースティングによる非構造的臨床試験物語における線量誤差の自動検出システムを提案する。
提案手法は,従来のNLP(TF-IDF,キャラクタn-grams),密接なセマンティック埋め込み(All-MiniLM-L6v2),ドメイン固有の医療パターン,トランスフォーマーベースのスコア(BiomedBERT,DeBERTa-v3)を対象とし,LightGBMモデルのトレーニングを行う。
9つの相補的テキストフィールド(サンプルあたり5,400文字)から特徴を抽出し,42,112の治験物語を網羅する。
重度のクラス不均衡(4.9%の陽性率)を持つCT-DEBベンチマークデータセットでは、5倍アンサンブル平均化(クロスバリデーション: 0.8833 + 0.0091 AUC)により0.8725のテストROC-AUCを達成する。
体系的アブレーション研究により、文の埋め込みを除去すると最大の性能低下(2.39%)が起こり、全体の特徴の重要性の37.07%にしか寄与していないにもかかわらず、その重要な役割が証明される。
特徴効率解析により、トップ500-1000の特徴の選択は最適な性能(0.886-0.887 AUC)を示し、有効雑音低減による3,451個の特徴セット(0.879 AUC)よりも優れていた。
本研究は, 正規化手法としての特徴選択の重要性を強調し, 厳格なクラス不均衡下での専門的臨床テキスト分類において, まばらな語彙的特徴が高密度な表現と相補的であることを示した。
関連論文リスト
- DeepFAN, a transformer-based deep learning model for human-artificial intelligence collaborative assessment of incidental pulmonary nodules in CT scans: a multi-reader, multi-case trial [35.165807838511064]
DeepFANは10K以上の病理確認ノジュールに基づいてトレーニングされたトランスフォーマーベースのモデルである。
結節レベルの読取者間診断の整合性は公正から中等度に改善した。
DeepFANは、中等放射線科医を効果的に支援し、診断品質の均質化を支援する。
論文 参考訳(メタデータ) (2026-03-26T16:24:56Z) - A Detection-Gated Pipeline for Robust Glottal Area Waveform Extraction and Clinical Pathology Assessment [0.0]
本稿では,ローカライザとセグメンタを統合した検出ゲートパイプラインを提案する。
パイプラインはGIRAFEとBAGLSベンチマークで最先端の一貫性を達成した。
論文 参考訳(メタデータ) (2026-03-02T17:05:41Z) - COPE: Chain-Of-Thought Prediction Engine for Open-Source Large Language Model Based Stroke Outcome Prediction from Clinical Notes [23.044580867637105]
CoT (Chain-of-Thought) Outcome Prediction Engine (COPE) は、構造化されていない臨床ノートから結果を予測するための推論強化された大規模言語モデルフレームワークである。
本研究は急性虚血性脳梗塞(AIS)464例と90日間のRanin Scale(mRS)スコアを比較検討した。
COPEは1.01 (95% CI 0.92-1.11), +/-1 の精度 74.4% (69.9, 78.8%), 正確な精度 32.8% (28.0, 37.6%) を達成した。
論文 参考訳(メタデータ) (2025-12-02T07:44:20Z) - Transparent Early ICU Mortality Prediction with Clinical Transformer and Per-Case Modality Attribution [42.85462513661566]
ICU滞在後48時間から, 生理的時系列測定と非構造的臨床記録とを融合した, 軽量で透明なマルチモーダルアンサンブルを提案する。
ロジスティック回帰モデルは、バイタル用双方向LSTMとノート用微調整された臨床ModernBERT変換器の2つのモード固有モデルからの予測を組み合わせる。
MIMIC-IIIベンチマークでは、遅延融合アンサンブルは、よく校正された予測を維持しながら、最高の単一モデルに対する差別を改善する。
論文 参考訳(メタデータ) (2025-11-19T20:11:49Z) - Automated Radiographic Total Sharp Score (ARTSS) in Rheumatoid Arthritis: A Solution to Reduce Inter-Intra Reader Variation and Enhancing Clinical Practice [3.8516555293145345]
本研究では、深層学習を利用して全手X線画像を解析する自動放射線シャープ符号化フレームワークを提案する。
I) ResNet50, II) UNet.3, III) YOLOv7, IV) VGG16, VGG19, ResNet50, DenseNet201, EfficientNetB0, Vision Transformer (ViT) などのモデルを用いた手指分割による手指識別
論文 参考訳(メタデータ) (2025-09-08T16:21:45Z) - Automatic Cough Analysis for Non-Small Cell Lung Cancer Detection [33.37223681850477]
非小細胞肺癌(NSCLC)の早期発見は患者の予後改善に重要である。
本研究では,NSCLC患者と健常者との鑑別のためのスクリーニングツールとして,自動コークス分析の利用について検討する。
記録は、サポートベクタマシン(SVM)やXGBoostといった機械学習技術を用いて分析された。
論文 参考訳(メタデータ) (2025-07-25T11:30:22Z) - Can Reasoning LLMs Enhance Clinical Document Classification? [7.026393789313748]
大規模言語モデル(LLM)は、このタスクの正確性と効率性において有望な改善を提供する。
本研究では,8つのLDMの性能と一貫性を評価する。4つの推論(Qwen QWQ, Deepseek Reasoner, GPT o3 Mini, Gemini 2.0 Flash Thinking)と4つの非推論(Llama 3.3, GPT 4o Mini, Gemini 2.0 Flash, Deepseek Chat)。
その結果、推論モデルは精度71%(68%)とF1スコア(67%(60%))で非推論モデルを上回った。
論文 参考訳(メタデータ) (2025-04-10T18:00:27Z) - Artificial Intelligence-Based Triaging of Cutaneous Melanocytic Lesions [0.8864540224289991]
患者数の増加とより包括的な診断の必要性により、病理学者は作業負荷の増大に直面している。
われわれは,全スライド画像に基づいて皮膚メラノサイト性病変をトリアージする人工知能(AI)モデルを開発した。
論文 参考訳(メタデータ) (2024-10-14T13:49:04Z) - CACER: Clinical Concept Annotations for Cancer Events and Relations [22.866006682711284]
本研究は,48,000件以上の医学的問題と薬物イベントに対する微粒な注釈付き新規コーパスCACERについて紹介する。
微調整および文脈内学習を用いたトランスフォーマーに基づく情報抽出モデルの開発と評価を行う。
論文 参考訳(メタデータ) (2024-09-05T20:42:35Z) - Harvesting, Detecting, and Characterizing Liver Lesions from Large-scale
Multi-phase CT Data via Deep Dynamic Texture Learning [24.633802585888812]
ダイナミックコントラストCT(Dynamic contrast Computed Tomography)のための完全自動多段階肝腫瘍評価フレームワークを提案する。
本システムでは, 腫瘍提案検出, 腫瘍採取, 原発部位の選択, 深部テクスチャに基づく腫瘍評価の4段階からなる。
論文 参考訳(メタデータ) (2020-06-28T19:55:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。