論文の概要: LAVA: Language Model Assisted Verbal Autopsy for Cause-of-Death Determination
- arxiv url: http://arxiv.org/abs/2509.09602v1
- Date: Thu, 11 Sep 2025 16:42:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-12 16:52:24.476582
- Title: LAVA: Language Model Assisted Verbal Autopsy for Cause-of-Death Determination
- Title(参考訳): LAVA: 死の因果決定のための言語モデルによる言語解剖支援
- Authors: Yiqun T. Chen, Tyler H. McCormick, Li Liu, Abhirup Datta,
- Abstract要約: 本研究では,Large Language Models (LLM) と従来のアルゴリズムアプローチを組み合わせた概念実証パイプラインであるLA-VAについて述べる。
GPT-5は,48.6% (Adult), 50.5% (Child), 53.5% (Neonate) の平均試験成績が最も高い。
以上の結果から,LLMを用いた簡便なアプローチは,低リソース環境下でのグローバルヘルス監視に重要な意味を持つとともに,言語解剖の精度を大幅に向上させる可能性が示唆された。
- 参考スコア(独自算出の注目度): 9.42563016778926
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Verbal autopsy (VA) is a critical tool for estimating causes of death in resource-limited settings where medical certification is unavailable. This study presents LA-VA, a proof-of-concept pipeline that combines Large Language Models (LLMs) with traditional algorithmic approaches and embedding-based classification for improved cause-of-death prediction. Using the Population Health Metrics Research Consortium (PHMRC) dataset across three age categories (Adult: 7,580; Child: 1,960; Neonate: 2,438), we evaluate multiple approaches: GPT-5 predictions, LCVA baseline, text embeddings, and meta-learner ensembles. Our results demonstrate that GPT-5 achieves the highest individual performance with average test site accuracies of 48.6% (Adult), 50.5% (Child), and 53.5% (Neonate), outperforming traditional statistical machine learning baselines by 5-10%. Our findings suggest that simple off-the-shelf LLM-assisted approaches could substantially improve verbal autopsy accuracy, with important implications for global health surveillance in low-resource settings.
- Abstract(参考訳): バーバル解剖(英: Verbal autopsy, VA)は、医学的診断が不可能なリソース制限された環境での死因を推定するための重要なツールである。
本研究では,Large Language Models (LLM) と従来のアルゴリズムアプローチを組み合わせた概念実証パイプラインであるLA-VAについて述べる。
GPT-5予測,LCVAベースライン,テキスト埋め込み,メタラーナーアンサンブルの3つの年齢カテゴリ(Adult: 7,580; Child: 1,960; Neonate: 2,438)にまたがるPopulation Health Metrics Research Consortium(PHMRC)データセットを用いて,複数のアプローチを評価した。
以上の結果から, GPT-5は平均テストサイト精度48.6% (Adult), 50.5% (Child), 53.5% (Neonate), 従来の統計的機械学習ベースラインよりも5-10%向上した。
以上の結果から,LLMを用いた簡便なアプローチは,低リソース環境下でのグローバルヘルス監視に重要な意味を持つとともに,言語解剖の精度を大幅に向上させる可能性が示唆された。
関連論文リスト
- MedHELM: Holistic Evaluation of Large Language Models for Medical Tasks [47.486705282473984]
大規模言語モデル(LLM)は、医学試験においてほぼ完璧なスコアを得る。
これらの評価は、実際の臨床実践の複雑さと多様性を不十分に反映している。
MedHELMは,医療業務におけるLCMの性能を評価するための評価フレームワークである。
論文 参考訳(メタデータ) (2025-05-26T22:55:49Z) - Paging Dr. GPT: Extracting Information from Clinical Notes to Enhance Patient Predictions [0.25165775267615204]
GPT-4o-mini (ChatGPT) による患者に対する簡単な臨床質問に対する回答が患者レベルの死亡予測にどう役立つかを検討する。
MIMIC-IV Noteデータセットにおける14,011件の初診データや心血管集中治療ユニットのデータを用いて,GPT応答をロジスティック回帰モデルにおける入力特徴として用いた透明なフレームワークを実装した。
論文 参考訳(メタデータ) (2025-04-14T17:41:45Z) - Explainable AI for Mental Health Emergency Returns: Integrating LLMs with Predictive Modeling [2.466324275447403]
救急部門(ED)は精神状態の回復が大きな医療負担となり、患者の24-27%が30日以内に帰国する。
大規模言語モデル(LLM)と機械学習を統合することにより、EDメンタルヘルスリターンリスクモデルの予測精度と臨床的解釈性が向上するか否かを評価する。
論文 参考訳(メタデータ) (2025-01-21T15:41:20Z) - Mortality Prediction of Pulmonary Embolism Patients with Deep Learning and XGBoost [0.5942186563711294]
肺塞栓症(PE)は死亡率と致命的な疾患の主要な原因である。
従来の臨床手法では, PE患者の30日間の院内死亡を予測できた。
論文 参考訳(メタデータ) (2024-11-27T05:15:55Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Classification Methods Based on Machine Learning for the Analysis of
Fetal Health Data [1.3597551064547502]
胎児健康分析のための各種機械学習モデルの分類性能について検討した。
胎児の健康データセット上のTabNetモデルは、94.36%の分類精度を提供する。
論文 参考訳(メタデータ) (2023-11-18T04:01:46Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。