論文の概要: Improving Drug Identification in Overdose Death Surveillance using Large Language Models
- arxiv url: http://arxiv.org/abs/2507.12679v1
- Date: Wed, 16 Jul 2025 23:29:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-18 20:10:24.300503
- Title: Improving Drug Identification in Overdose Death Surveillance using Large Language Models
- Title(参考訳): 大規模言語モデルを用いた過剰死亡サーベイランスにおける薬物識別の改善
- Authors: Arthur J. Funnell, Panayiotis Petousis, Fabrice Harel-Canada, Ruby Romero, Alex A. T. Bui, Adam Koncsol, Hritika Chaturvedi, Chelsea Shover, David Goodman-Meza,
- Abstract要約: フェンタニルによる米国における薬物関連の死亡率の上昇は、タイムリーかつ正確な監視を必要としている。
クリティカルな過剰なデータは、しばしばフリーテキスト・クローナのレポートに埋もれ、ICD-10の分類に符号化されると遅延と情報損失が発生する。
自然言語処理モデルは過剰な監視を自動化し、強化するが、以前のアプリケーションは限られていた。
- 参考スコア(独自算出の注目度): 1.8239746935427605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rising rate of drug-related deaths in the United States, largely driven by fentanyl, requires timely and accurate surveillance. However, critical overdose data are often buried in free-text coroner reports, leading to delays and information loss when coded into ICD (International Classification of Disease)-10 classifications. Natural language processing (NLP) models may automate and enhance overdose surveillance, but prior applications have been limited. A dataset of 35,433 death records from multiple U.S. jurisdictions in 2020 was used for model training and internal testing. External validation was conducted using a novel separate dataset of 3,335 records from 2023-2024. Multiple NLP approaches were evaluated for classifying specific drug involvement from unstructured death certificate text. These included traditional single- and multi-label classifiers, as well as fine-tuned encoder-only language models such as Bidirectional Encoder Representations from Transformers (BERT) and BioClinicalBERT, and contemporary decoder-only large language models such as Qwen 3 and Llama 3. Model performance was assessed using macro-averaged F1 scores, and 95% confidence intervals were calculated to quantify uncertainty. Fine-tuned BioClinicalBERT models achieved near-perfect performance, with macro F1 scores >=0.998 on the internal test set. External validation confirmed robustness (macro F1=0.966), outperforming conventional machine learning, general-domain BERT models, and various decoder-only large language models. NLP models, particularly fine-tuned clinical variants like BioClinicalBERT, offer a highly accurate and scalable solution for overdose death classification from free-text reports. These methods can significantly accelerate surveillance workflows, overcoming the limitations of manual ICD-10 coding and supporting near real-time detection of emerging substance use trends.
- Abstract(参考訳): フェンタニルによる米国における薬物関連の死亡率の上昇は、タイムリーかつ正確な監視を必要としている。
しかし、重要な過剰摂取データは、しばしばフリーテキスト・クローナのレポートに埋もれており、ICD-10の分類に符号化されると遅延や情報損失が発生する。
自然言語処理(NLP)モデルは過剰な監視を自動化し、強化するが、以前のアプリケーションは限られていた。
2020年に米国の複数の司法管轄区域から35,433件の死亡記録のデータセットが、モデルトレーニングと内部テストに使用された。
2023-2024年から3,335レコードの新たなデータセットを用いて外部検証を行った。
非構造化死証明テキストから特定の薬物の関与を分類するための複数のNLPアプローチを評価した。
これには、従来のシングルラベルおよびマルチラベルの分類器や、双方向エンコーダ表現(BERT)やBioClinicalBERTのような微調整エンコーダのみの言語モデル、Qwen 3やLlama 3のような現代のデコーダのみの大規模言語モデルが含まれる。
モデル性能をマクロ平均F1スコアを用いて評価し,95%の信頼区間を算出して不確実性を定量化した。
微調整されたBioClinicalBERTモデルは、内部テストセットでマクロF1スコア>=0.998でほぼ完全な性能を達成した。
外部検証によりロバスト性(macro F1=0.966)が確認され、従来の機械学習、一般ドメインBERTモデル、および様々なデコーダのみの大規模言語モデルよりも優れていた。
NLPモデル、特にBioClinicalBERTのような微調整された臨床変種は、自由テキストレポートからの過剰な死亡分類に対して、非常に正確でスケーラブルなソリューションを提供する。
これらの手法は、手動ICD-10符号化の限界を克服し、出現する物質利用トレンドのほぼリアルタイム検出をサポートすることにより、監視ワークフローを著しく加速させることができる。
関連論文リスト
- CRTRE: Causal Rule Generation with Target Trial Emulation Framework [47.2836994469923]
ターゲットトライアルエミュレーションフレームワーク(CRTRE)を用いた因果ルール生成という新しい手法を提案する。
CRTREは、アソシエーションルールの因果効果を推定するためにランダム化トライアル設計原則を適用している。
次に、病気発症予測などの下流アプリケーションにそのような関連ルールを組み込む。
論文 参考訳(メタデータ) (2024-11-10T02:40:06Z) - Multi-stream deep learning framework to predict mild cognitive impairment with Rey Complex Figure Test [10.324611550865926]
2つの異なる処理ストリームを統合するマルチストリームディープラーニングフレームワークを開発した。
提案したマルチストリームモデルは,外部検証においてベースラインモデルよりも優れた性能を示した。
本モデルは,早期スクリーニングのための費用対効果のあるツールとして機能する,臨床現場における実用的意味を持つ。
論文 参考訳(メタデータ) (2024-09-04T17:08:04Z) - Improving ICD coding using Chapter based Named Entities and Attentional Models [0.0]
我々は、章ベースの名前付きエンティティと注意モデルを用いて、F1スコアを改善するICD符号化の強化アプローチを導入する。
本手法は, 放電サマリーをICD-9章に分類し, 章別データを用いた注意モデルを開発する。
分類には第IV章を使用し、ニューラルネットワークを使わずに重要な要素や重みをデバイアスし、影響を及ぼす。
論文 参考訳(メタデータ) (2024-07-24T12:34:23Z) - Deep Omni-supervised Learning for Rib Fracture Detection from Chest
Radiology Images [41.62893318123283]
ディープラーニング(DL)に基づくリブ骨折検出は、死亡を予防し、患者の予後を改善する上で重要な役割を担っている。
DLベースのオブジェクト検出モデルは、大量のバウンディングボックスアノテーションを必要とします。
医用データの注釈付けは時間がかかり専門知識が要求されるため、大量の細かい注釈を得られることは極めて不可能である。
我々は,ORF-Netv2という新しいオブジェクト検出ネットワークを提案する。
論文 参考訳(メタデータ) (2023-06-23T05:36:03Z) - Continuous time recurrent neural networks: overview and application to
forecasting blood glucose in the intensive care unit [56.801856519460465]
連続時間自己回帰リカレントニューラルネットワーク(Continuous Time Autoregressive Recurrent Neural Network, CTRNN)は、不規則な観測を考慮に入れたディープラーニングモデルである。
重篤なケア環境下での血糖値の確率予測へのこれらのモデルの適用を実証する。
論文 参考訳(メタデータ) (2023-04-14T09:39:06Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Secondary Use of Clinical Problem List Entries for Neural Network-Based
Disease Code Assignment [1.3190581566723918]
国際疾患分類(ICD-10)を用いた50文字長大臨床問題リストの自動符号化の検討
fastTextベースラインは、マクロ平均F1スコアの0.83に到達し、その後、マクロ平均F1スコアの0.84に文字レベルLSTMが続いた。
ニューラルネットワークのアクティベーション分析と、偽陽性と偽陰性の調査により、一貫性のない手動コーディングが主な制限因子として明らかにされた。
論文 参考訳(メタデータ) (2021-12-27T16:11:05Z) - Multiple Organ Failure Prediction with Classifier-Guided Generative
Adversarial Imputation Networks [4.040013871160853]
多臓器不全 (MOF) は集中治療室 (ICU) 患者の死亡率が高い重篤な症候群である。
機械学習モデルを電子健康記録に適用することは、欠落した値の広範性のために難しい。
論文 参考訳(メタデータ) (2021-06-22T15:49:01Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。