論文の概要: Multi-Label Classification with Generative AI Models in Healthcare: A Case Study of Suicidality and Risk Factors
- arxiv url: http://arxiv.org/abs/2507.17009v1
- Date: Tue, 22 Jul 2025 20:44:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-24 22:33:14.767268
- Title: Multi-Label Classification with Generative AI Models in Healthcare: A Case Study of Suicidality and Risk Factors
- Title(参考訳): 医療におけるジェネレーティブAIモデルを用いたマルチラベル分類 : 自殺率とリスクファクターのケーススタディ
- Authors: Ming Huang, Zehan Li, Yan Hu, Wanjing Wang, Andrew Wen, Scott Lane, Salih Selek, Lokesh Shahani, Rodrigo Machado-Vieira, Jair Soares, Hua Xu, Hongfang Liu,
- Abstract要約: 本研究では、自殺関連因子(SrFs)の多ラベル分類(MLC)における生成型大規模言語モデル(LLMs)、特にGPT-3.5およびGPT-4.5の使用について検討する。
本稿では,新しいエンドツーエンド生成パイプラインを提案するとともに,ラベルセットレベルのメトリクスや,エラー解析のためのマルチラベル混同行列など,高度な評価手法を提案する。
本研究は,SIとSAの融合などの系統的誤りパターンを明らかにし,ラベル付けに慎重な傾向を示す。
- 参考スコア(独自算出の注目度): 9.89999399520808
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Suicide remains a pressing global health crisis, with over 720,000 deaths annually and millions more affected by suicide ideation (SI) and suicide attempts (SA). Early identification of suicidality-related factors (SrFs), including SI, SA, exposure to suicide (ES), and non-suicidal self-injury (NSSI), is critical for timely intervention. While prior studies have applied AI to detect SrFs in clinical notes, most treat suicidality as a binary classification task, overlooking the complexity of cooccurring risk factors. This study explores the use of generative large language models (LLMs), specifically GPT-3.5 and GPT-4.5, for multi-label classification (MLC) of SrFs from psychiatric electronic health records (EHRs). We present a novel end to end generative MLC pipeline and introduce advanced evaluation methods, including label set level metrics and a multilabel confusion matrix for error analysis. Finetuned GPT-3.5 achieved top performance with 0.94 partial match accuracy and 0.91 F1 score, while GPT-4.5 with guided prompting showed superior performance across label sets, including rare or minority label sets, indicating a more balanced and robust performance. Our findings reveal systematic error patterns, such as the conflation of SI and SA, and highlight the models tendency toward cautious over labeling. This work not only demonstrates the feasibility of using generative AI for complex clinical classification tasks but also provides a blueprint for structuring unstructured EHR data to support large scale clinical research and evidence based medicine.
- Abstract(参考訳): 自殺はいまだに世界的な健康危機であり、毎年72万人以上が死亡し、自殺のアイデア(SI)や自殺未遂(SA)の影響が何百万にも及ぶ。
自殺関連因子 (SrFs) の早期同定は, SI, SA, 自殺への曝露 (ES), 非自殺自傷 (NSSI) が時間的介入に重要である。
これまでの研究では、臨床ノートでSrFを検出するためにAIを適用してきたが、多くの場合、自殺を二分分類タスクとして扱い、共起リスク因子の複雑さを見越す。
本研究では,SrFの多ラベル分類(MLC)におけるLLM,特にGPT-3.5およびGPT-4.5の使用について検討した。
本稿では,新しい終端生成型LCCパイプラインを提案し,エラー解析のためのラベルセットレベルメトリクスとマルチラベル混乱行列を含む高度な評価手法を提案する。
精巧なGPT-3.5は0.94のパーシャルマッチ精度と0.91のF1スコアでトップパフォーマンスを達成し、ガイド付きプロンプト付きGPT-4.5はレアまたはマイノリティのラベルセットを含むラベルセット間で優れたパフォーマンスを示し、バランスが良くロバストなパフォーマンスを示した。
本研究は,SIとSAの融合などの系統的誤りパターンを明らかにし,ラベル付けに慎重な傾向を示す。
この研究は、複雑な臨床分類タスクに生成AIを使用することの可能性を示すだけでなく、大規模臨床研究とエビデンスベースの医療を支援するために、構造化されていないEHRデータを構築するための青写真を提供する。
関連論文リスト
- LLM-Augmented Symptom Analysis for Cardiovascular Disease Risk Prediction: A Clinical NLP [2.2615384250361004]
本研究は, 症状抽出, 文脈推論, 自由テキストレポートからの相関に, ドメイン適応型大言語モデルを用いた, 新規なLLM拡張臨床NLPパイプラインを提案する。
MIMIC-IIIおよびCARDIO-NLPデータセットの評価は、精度、リコール、F1スコア、AUROCにおいて高い臨床関連性を示した。
論文 参考訳(メタデータ) (2025-07-15T07:32:16Z) - A Weakly Supervised Transformer to Support Rare Disease Diagnosis from Electronic Health Records: Methods and Applications in Rare Pulmonary Disease [16.112294460618955]
希少な病気は世界中で推定3億~4億人に影響を及ぼす。
計算表現型アルゴリズムは 希少な疾患の検出を 約束している
我々は,ゴールド標準ラベルの小さなセットと,反復的に更新された銀標準ラベルの量を組み合わせた,弱い教師付きトランスフォーマーベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-01T23:11:20Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Detecting PTSD in Clinical Interviews: A Comparative Analysis of NLP Methods and Large Language Models [6.916082619621498]
外傷後ストレス障害 (PTSD) は, 臨床現場ではまだ診断されていない。
本研究では,臨床面接書からPTSDを検出するための自然言語処理手法について検討した。
論文 参考訳(メタデータ) (2025-04-01T22:06:28Z) - A Vector-Quantized Foundation Model for Patient Behavior Monitoring [43.02353546717171]
本稿では,スマートフォンやウェアラブルデバイスからの実世界のデータを処理するために設計されたベクトル量子化変分自動エンコーダを改良した基礎モデルを提案する。
本研究では, 個別の潜伏表現を利用して, 微調整を必要とせず, 2つの下流課題, 自殺リスク評価, 情緒的状態予測を効果的に実施した。
論文 参考訳(メタデータ) (2025-03-19T14:01:16Z) - Suicide Phenotyping from Clinical Notes in Safety-Net Psychiatric Hospital Using Multi-Label Classification with Pre-Trained Language Models [10.384299115679369]
事前訓練された言語モデルは、非構造的な臨床物語から自殺を識別する約束を提供する。
2つの微調整戦略を用いて4つのBERTモデルの性能評価を行った。
その結果, モデル最適化, ドメイン関連データによる事前学習, 単一マルチラベル分類戦略により, 自殺表現のモデル性能が向上することが示唆された。
論文 参考訳(メタデータ) (2024-09-27T16:13:38Z) - Optimizing Mortality Prediction for ICU Heart Failure Patients: Leveraging XGBoost and Advanced Machine Learning with the MIMIC-III Database [1.5186937600119894]
心臓不全は世界中の何百万人もの人々に影響を与え、生活の質を著しく低下させ、高い死亡率をもたらす。
広範な研究にもかかわらず、ICU患者の心不全と死亡率の関係は、完全には理解されていない。
本研究は、ICD-9コードを用いて、MIMIC-IIIデータベースから18歳以上の1,177人のデータを解析した。
論文 参考訳(メタデータ) (2024-09-03T07:57:08Z) - SOS-1K: A Fine-grained Suicide Risk Classification Dataset for Chinese Social Media Analysis [22.709733830774788]
本研究では,自殺リスクの詳細な分類を目的とした,中国のソーシャルメディアデータセットを提案する。
事前訓練した7つのモデルについて, 自殺リスクが高い, 自殺リスクが少ない, 自殺リスクの細かい分類が0~10の2つのタスクで評価された。
ディープラーニングモデルは高い自殺リスクと低い自殺リスクを区別する上で優れた性能を示し、最良のモデルはF1スコア88.39%である。
論文 参考訳(メタデータ) (2024-04-19T06:58:51Z) - Fairness Evolution in Continual Learning for Medical Imaging [47.52603262576663]
本研究では、ドメイン固有の公平度指標を用いてタスク間でバイアスがどのように進化し、異なるCL戦略がこの進化にどのように影響するかを検討する。
以上の結果から,擬似ラベルと擬似ラベルの学習は最適分類性能を実現するが,擬似ラベルの偏りは小さいことが示唆された。
論文 参考訳(メタデータ) (2024-04-10T09:48:52Z) - Multimodal Pretraining of Medical Time Series and Notes [45.89025874396911]
ディープラーニングモデルは、意味のあるパターンを抽出する際の約束を示すが、広範囲なラベル付きデータが必要である。
本稿では,臨床測定値とノートのアライメントに着目し,自己指導型事前学習を用いた新しいアプローチを提案する。
病院内での死亡予測や表現型化などの下流タスクでは、データのごく一部がラベル付けされた設定において、ベースラインよりも優れています。
論文 参考訳(メタデータ) (2023-12-11T21:53:40Z) - Bag of Tricks for Long-Tailed Multi-Label Classification on Chest X-Rays [40.11576642444264]
本報告では,ICCV CVAMD 2023 CXR-LT コンペティションにおけるソリューションの概要について述べる。
我々は,CXR診断の有効性を,いくつかの先進的な設計を統合することで実証的に検討した。
私たちのフレームワークは最終的に、競争テストセットで0.349 mAPを獲得し、トップ5にランクインしました。
論文 参考訳(メタデータ) (2023-08-17T08:25:55Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Am I No Good? Towards Detecting Perceived Burdensomeness and Thwarted
Belongingness from Suicide Notes [51.378225388679425]
本稿では,自殺ノートから知覚的バーデンサムネス(PB)とThwarted Belongingness(TB)を検出する新しい課題に対処するエンドツーエンドマルチタスクシステムを提案する。
また、ベンチマークCEASE-v2.0データセットに基づいて、手動で翻訳したコード混合自殺メモコーパス、CoMCEASE-v2.0を導入する。
自殺ノートの時間方向と感情情報を利用して全体のパフォーマンスを向上する。
論文 参考訳(メタデータ) (2022-05-20T06:31:08Z) - SCRIB: Set-classifier with Class-specific Risk Bounds for Blackbox
Models [48.374678491735665]
クラス固有RIsk境界(SCRIB)を用いたSet-classifierを導入し,この問題に対処する。
SCRIBは、クラス固有の予測リスクを理論的保証で制御するセット分類器を構築する。
脳波(EEG)データによる睡眠ステージング,X線COVID画像分類,心電図(ECG)データに基づく心房細動検出など,いくつかの医学的応用についてSCRIBを検証した。
論文 参考訳(メタデータ) (2021-03-05T21:06:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。