論文の概要: Automating Thematic Review of Prevention of Future Deaths Reports: Replicating the ONS Child Suicide Study using Large Language Models
- arxiv url: http://arxiv.org/abs/2507.20786v1
- Date: Mon, 28 Jul 2025 12:56:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:58.12112
- Title: Automating Thematic Review of Prevention of Future Deaths Reports: Replicating the ONS Child Suicide Study using Large Language Models
- Title(参考訳): 将来の死亡予防の自動化テーマレビュー:大規模言語モデルを用いたOnS子自殺研究のリプリケート
- Authors: Sam Osian, Arpan Dutta, Sahil Bhandari, Iain E. Buchan, Dan W. Joyce,
- Abstract要約: 2025年、国家統計局は児童自殺PFDの報告に関する全国的な論文を発表した。
完全自動化された"text-to-table"言語モデルパイプラインがONSの識別と,児童自殺PFDレポートのテーマ分析を再現できるかどうかを検討した。
PFD Toolkitは72件の児童自殺PFDレポートを特定した。
- 参考スコア(独自算出の注目度): 1.1380162891529537
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Prevention of Future Deaths (PFD) reports, issued by coroners in England and Wales, flag systemic hazards that may lead to further loss of life. Analysis of these reports has previously been constrained by the manual effort required to identify and code relevant cases. In 2025, the Office for National Statistics (ONS) published a national thematic review of child-suicide PFD reports ($\leq$ 18 years), identifying 37 cases from January 2015 to November 2023 - a process based entirely on manual curation and coding. We evaluated whether a fully automated, open source "text-to-table" language-model pipeline (PFD Toolkit) could reproduce the ONS's identification and thematic analysis of child-suicide PFD reports, and assessed gains in efficiency and reliability. All 4,249 PFD reports published from July 2013 to November 2023 were processed via PFD Toolkit's large language model pipelines. Automated screening identified cases where the coroner attributed death to suicide in individuals aged 18 or younger, and eligible reports were coded for recipient category and 23 concern sub-themes, replicating the ONS coding frame. PFD Toolkit identified 72 child-suicide PFD reports - almost twice the ONS count. Three blinded clinicians adjudicated a stratified sample of 144 reports to validate the child-suicide screening. Against the post-consensus clinical annotations, the LLM-based workflow showed substantial to almost-perfect agreement (Cohen's $\kappa$ = 0.82, 95% CI: 0.66-0.98, raw agreement = 91%). The end-to-end script runtime was 8m 16s, transforming a process that previously took months into one that can be completed in minutes. This demonstrates that automated LLM analysis can reliably and efficiently replicate manual thematic reviews of coronial data, enabling scalable, reproducible, and timely insights for public health and safety. The PFD Toolkit is openly available for future research.
- Abstract(参考訳): イングランドとウェールズの検視官が発行したPFD報告書は、生命のさらなる喪失につながる可能性のある全身的な危険を警告している。
これらのレポートの分析は、以前、関連するケースを特定し、コードするために必要な手作業によって制約されていた。
2025年、国家統計局(ONS)は、2015年1月から2023年11月までに37件のケースを特定した児童自殺PFD報告書(18年)の全国的なテーマレビューを発表した。
完全自動化されたオープンソースの"text-to-table"言語モデルパイプライン(PFD Toolkit)が,小児自殺PFDレポートの識別とテーマ分析を再現できるかどうかを検証し,効率と信頼性の向上を評価した。
2013年7月から2023年11月までの4,249件のPFDレポートはPFD Toolkitの大規模言語モデルパイプラインを通じて処理された。
検視の結果、検死官が18歳未満の患者で死亡と推定された症例を自動検査し、受取人のカテゴリと23のサブテーマに関する報告をコード化し、ONSのコーディングフレームを複製した。
PFD Toolkitは72件の児童自殺PFDレポートを特定した。
盲目の3人の臨床医は、児童自殺検診を検証するため、144件の報告を成層化して提出した。
コンセンサス後の臨床アノテーションに対して、LLMベースのワークフローはほぼ完全に一致した(Cohen's $\kappa$ = 0.82, 95% CI: 0.66-0.98, raw agreement = 91%)。
エンドツーエンドのスクリプトランタイムは8m 16sで、これまで数ヶ月を要したプロセスを数分で完了したプロセスに変換する。
このことは、自動LLM分析が、冠動脈データの手動によるテーマレビューを確実かつ効率的に再現し、スケーラブルで再現可能なタイムリーな洞察を公衆の健康と安全のために実現できることを実証している。
PFD Toolkitは、将来の研究のために公開されています。
関連論文リスト
- Improving Drug Identification in Overdose Death Surveillance using Large Language Models [1.8239746935427605]
フェンタニルによる米国における薬物関連の死亡率の上昇は、タイムリーかつ正確な監視を必要としている。
クリティカルな過剰なデータは、しばしばフリーテキスト・クローナのレポートに埋もれ、ICD-10の分類に符号化されると遅延と情報損失が発生する。
自然言語処理モデルは過剰な監視を自動化し、強化するが、以前のアプリケーションは限られていた。
論文 参考訳(メタデータ) (2025-07-16T23:29:19Z) - MIMIC-IV-Ext-PE: Using a large language model to predict pulmonary embolism phenotype in the MIMIC-IV dataset [0.0]
肺塞栓症は院内死亡予防の主因である。
研究用のPEラベルを含む大規模な公開データセットは少ない。
我々はCTPAスキャンで得られた全放射線診断報告を抽出し、2名の医師が手動でPE陽性(急性PE)またはPE陰性(PE陰性)と診断した。
我々は、ラベルを自動的に抽出するために、以前に微調整されたBio_ClinicalBERT変換言語モデル、VTE-BERTを適用した。
論文 参考訳(メタデータ) (2024-10-29T19:28:44Z) - Non-Invasive Suicide Risk Prediction Through Speech Analysis [74.8396086718266]
自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
我々は、wav2vec、解釈可能な音声・音響特徴、深層学習に基づくスペクトル表現の3つの特徴セットを抽出する。
我々の最も効果的な音声モデルは、6.6.2,%$のバランスの取れた精度を達成する。
論文 参考訳(メタデータ) (2024-04-18T12:33:57Z) - Exploiting prompt learning with pre-trained language models for
Alzheimer's Disease detection [70.86672569101536]
アルツハイマー病(AD)の早期診断は予防ケアの促進とさらなる進行の遅らせに不可欠である。
本稿では,AD分類誤差をトレーニング対象関数として一貫して用いたPLMの高速微調整法について検討する。
論文 参考訳(メタデータ) (2022-10-29T09:18:41Z) - Interpretable (not just posthoc-explainable) medical claims modeling for
discharge placement to prevent avoidable all-cause readmissions or death [2.198760145670348]
我々は回帰係数の変動を表現するために本質的に解釈可能な多レベルベイズフレームワークを開発した。
我々は,この枠組みを用いて,医療クレームを用いた生存モデルを定式化し,入院と死亡を予測した。
2009-2011年の入院エピソードに基づいて、2008年と2011年の医療受給者の5%のサンプルを用いてモデルを訓練し、2012年のエピソードでモデルを検証した。
論文 参考訳(メタデータ) (2022-08-28T06:19:32Z) - Coronavirus disease situation analysis and prediction using machine
learning: a study on Bangladeshi population [1.7188280334580195]
バングラデシュでは近年、死亡率と感染率の差が以前よりも大きくなっている。
本研究では、機械学習モデルを識別し、今後数日の感染と死亡率を予測する予測システムを作成する。
論文 参考訳(メタデータ) (2022-07-12T09:48:41Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Filter Drug-induced Liver Injury Literature with Natural Language
Processing and Ensemble Learning [0.0]
薬物性肝障害 (DILI) は、肝臓を損傷する薬物の副作用である。
重度DILI症例では肝不全や死亡などの生命予後も報告された。
過去の出版物からのデータ抽出は手動ラベリングに大きく依存している。
バイオメディカルテキストの自動処理を可能にする人工知能の最近の進歩
論文 参考訳(メタデータ) (2022-03-09T23:53:07Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。