論文の概要: Leveraging Language Models and Machine Learning in Verbal Autopsy Analysis
- arxiv url: http://arxiv.org/abs/2508.19274v1
- Date: Fri, 22 Aug 2025 21:40:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.335749
- Title: Leveraging Language Models and Machine Learning in Verbal Autopsy Analysis
- Title(参考訳): 言語モデルの活用と言語自動解析における機械学習
- Authors: Yue Chu,
- Abstract要約: 市民登録や生命統計のない国では、口頭解剖(VA)は死因を推定するための重要なツールである。
既存のVAの自動分類アルゴリズムは疑問のみを使用し、物語の情報を無視する。
本研究では,プレトレーニング言語モデル(PLM)と機械学習(ML)技術を用いて,VAナラティブをCODの自動分類に利用する方法を検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In countries without civil registration and vital statistics, verbal autopsy (VA) is a critical tool for estimating cause of death (COD) and inform policy priorities. In VA, interviewers ask proximal informants for details on the circumstances preceding a death, in the form of unstructured narratives and structured questions. Existing automated VA cause classification algorithms only use the questions and ignore the information in the narratives. In this thesis, we investigate how the VA narrative can be used for automated COD classification using pretrained language models (PLMs) and machine learning (ML) techniques. Using empirical data from South Africa, we demonstrate that with the narrative alone, transformer-based PLMs with task-specific fine-tuning outperform leading question-only algorithms at both the individual and population levels, particularly in identifying non-communicable diseases. We explore various multimodal fusion strategies combining narratives and questions in unified frameworks. Multimodal approaches further improve performance in COD classification, confirming that each modality has unique contributions and may capture valuable information that is not present in the other modality. We also characterize physician-perceived information sufficiency in VA. We describe variations in sufficiency levels by age and COD and demonstrate that classification accuracy is affected by sufficiency for both physicians and models. Overall, this thesis advances the growing body of knowledge at the intersection of natural language processing, epidemiology, and global health. It demonstrates the value of narrative in enhancing COD classification. Our findings underscore the need for more high-quality data from more diverse settings to use in training and fine-tuning PLM/ML methods, and offer valuable insights to guide the rethinking and redesign of the VA instrument and interview.
- Abstract(参考訳): 市民登録や生命統計のない国では、言語解剖(VA)は死因を推定し、政策の優先順位を知らせる重要なツールである。
VAでは、インタビュアーは、死の前の状況について、非構造的な物語や構造化された質問の形で、近親者に対して詳細を尋ねる。
既存のVAの自動分類アルゴリズムは疑問のみを使用し、物語の情報を無視する。
本稿では,プレトレーニング言語モデル(PLM)と機械学習(ML)技術を用いて,VAナラティブを自動COD分類に利用する方法を検討する。
南アフリカの実証データを用いて、タスク固有の微調整によるトランスフォーマーベースのPLMは、個人レベルと人口レベルで、特に通信不能な疾患の特定において、主要な質問専用アルゴリズムよりも優れていることを示す。
統合されたフレームワークにおける物語と質問を組み合わせた様々なマルチモーダル融合戦略について検討する。
マルチモーダルアプローチはCOD分類の性能をさらに向上させ、各モーダルに固有の寄与があることを確認し、他のモーダルに存在しない貴重な情報をキャプチャする。
また,VAにおける医師が知覚する情報充実度を特徴付ける。
年齢およびCODによる充足率の変動について記述し、分類精度が医師とモデル双方の充足率に影響されることを実証した。
全体として、この論文は自然言語処理、疫学、世界保健の共通点における知識の増大を推し進めている。
これはCOD分類の強化における物語の価値を示している。
我々の研究結果は、トレーニングや微調整のPLM/ML手法で使用する、より多様な設定による高品質なデータの必要性を強調し、VA機器の再考と再設計の指針となる貴重な洞察を提供する。
関連論文リスト
- Dementia Insights: A Context-Based MultiModal Approach [0.3749861135832073]
早期発見は、病気の進行を遅らせる可能性のあるタイムリーな介入に不可欠である。
テキストと音声のための大規模事前学習モデル(LPM)は、認知障害の識別において有望であることを示している。
本研究は,テキストデータと音声データを最高の性能のLPMを用いて統合する,コンテキストベースのマルチモーダル手法を提案する。
論文 参考訳(メタデータ) (2025-03-03T06:46:26Z) - Large Language Models for Healthcare Text Classification: A Systematic Review [4.8342038441006805]
大規模言語モデル(LLM)は、自然言語処理(NLP)のアプローチを根本的に変えた。
医療分野では、臨床ノートの分析、診断コーディング、その他のタスクにおいて、正確で費用効率のよいテキスト分類が不可欠である。
医療用テキストの自動分類にLLMを活用するために多くの研究がなされている。
論文 参考訳(メタデータ) (2025-03-03T04:16:13Z) - RespLLM: Unifying Audio and Text with Multimodal LLMs for Generalized Respiratory Health Prediction [20.974460332254544]
RespLLMは、呼吸健康予測のためのテキストと音声の表現を統一する新しいフレームワークである。
我々の研究は、異種データの知覚、聴取、理解が可能なマルチモーダルモデルの基礎を築いた。
論文 参考訳(メタデータ) (2024-10-07T17:06:11Z) - Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-29T23:19:28Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Improving Cause-of-Death Classification from Verbal Autopsy Reports [0.0]
自然言語処理(NLP)技術は、医療分野では不十分である。
死因は、信頼できる死亡登録システムを持たない場所での口頭解剖(VA)報告によって決定されることが多い。
本稿では,モノリンガル学習とマルチソースドメイン適応の2つのパラダイムに依存するシステムを提案する。
論文 参考訳(メタデータ) (2022-10-31T09:14:08Z) - Enabling Classifiers to Make Judgements Explicitly Aligned with Human
Values [73.82043713141142]
性差別/人種差別の検出や毒性検出などの多くのNLP分類タスクは、人間の値に基づいている。
本稿では,コマンド内で明示的に記述された人間の値に基づいて予測を行う,値整合型分類のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-14T09:10:49Z) - A Unified Understanding of Deep NLP Models for Text Classification [88.35418976241057]
我々は、テキスト分類のためのNLPモデルの統一的な理解を可能にする視覚解析ツールDeepNLPVisを開発した。
主要なアイデアは相互情報に基づく尺度であり、モデルの各レイヤがサンプル内の入力語の情報をどのように保持するかを定量的に説明する。
コーパスレベル、サンプルレベル、単語レベルビジュアライゼーションで構成されるマルチレベルビジュアライゼーションは、全体トレーニングセットから個々のサンプルまでの分析をサポートする。
論文 参考訳(メタデータ) (2022-06-19T08:55:07Z) - Using Machine Learning to Fuse Verbal Autopsy Narratives and Binary
Features in the Analysis of Deaths from Hyperglycaemia [0.0]
中低所得国は、死因に関するデータ不足から生じる課題に直面している
言語解剖は、堅牢な死亡登録システムなしで、地域内のCODに関する情報を提供することができる。
本研究では,VAレポートの構造化要素と非構造化要素の両方を分析する際に,各種機械学習手法の性能を評価する。
論文 参考訳(メタデータ) (2022-04-26T09:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。