論文の概要: Detecting HIV-Related Stigma in Clinical Narratives Using Large Language Models
- arxiv url: http://arxiv.org/abs/2604.07717v2
- Date: Sun, 12 Apr 2026 19:55:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 14:47:45.716409
- Title: Detecting HIV-Related Stigma in Clinical Narratives Using Large Language Models
- Title(参考訳): 大規模言語モデルを用いた臨床診断におけるHIV関連スティグマの検出
- Authors: Ziyi Chen, Yasir Khan, Mengyuan Zhang, Cheng Peng, Mengxian Lyu, Yiyang Liu, Krishna Vaddiparti, Robert L Cook, Mattia Prosperi, Yonghui Wu,
- Abstract要約: 本研究の目的は,臨床ノートからHIVスティグマを識別するための言語モデル(LLM)ベースのツールを開発することである。
2012年から2022年の間,フロリダ大学健康学部(UF)におけるPLWHの診療成績について検討した。
公的な態度、開示に関する懸念、否定的な自己イメージ、パーソナライズされたスティグマの4つのサブスケールに、合計1,332の文章が手動で注釈付けされた。
- 参考スコア(独自算出の注目度): 10.723891827798028
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human immunodeficiency virus (HIV)-related stigma is a critical psychosocial determinant of health for people living with HIV (PLWH), influencing mental health, engagement in care, and treatment outcomes. Although stigma-related experiences are documented in clinical narratives, there is a lack of off-the-shelf tools to extract and categorize them. This study aims to develop a large language model (LLM)-based tool for identifying HIV stigma from clinical notes. We identified clinical notes from PLWH receiving care at the University of Florida (UF) Health between 2012 and 2022. Candidate sentences were identified using expert-curated stigma-related keywords and iteratively expanded via clinical word embeddings. A total of 1,332 sentences were manually annotated across four stigma subscales: Concern with Public Attitudes, Disclosure Concerns, Negative Self-Image, and Personalized Stigma. We compared GatorTron-large and BERT as encoder-based baselines, and GPT-OSS-20B, LLaMA-8B, and MedGemma-27B as generative LLMs, under zero-shot and few-shot prompting. GatorTron-large achieved the best overall performance (Micro F1 = 0.62). Few-shot prompting substantially improved generative model performance, with 5-shot GPT-OSS-20B and LLaMA-8B achieving Micro-F1 scores of 0.57 and 0.59, respectively. Performance varied by stigma subscale, with Negative Self-Image showing the highest predictability and Personalized Stigma remaining the most challenging. Zero-shot generative inference exhibited non-trivial failure rates (up to 32%). This study develops the first practical NLP tool for identifying HIV stigma in clinical notes.
- Abstract(参考訳): ヒト免疫不全ウイルス(Human immunodeficiency virus (HIV)-related stigma)は、HIV (PLWH) に罹患する人々の健康を決定づける重要な精神社会的決定因子である。
スティグマに関する経験は臨床物語に記録されているが、それらを抽出し分類するための既成の道具が不足している。
本研究の目的は,臨床ノートからHIVスティグマを識別するための言語モデル(LLM)ベースのツールを開発することである。
2012年から2022年の間,フロリダ大学健康学部(UF)におけるPLWHの診療成績について検討した。
専門家によるスティグマ関連キーワードを用いて候補文を同定し,臨床用語の埋め込みにより反復的に拡張した。
公的な態度、開示に関する懸念、否定的な自己イメージ、パーソナライズされたスティグマの4つのサブスケールに、合計1,332の文章が手動で注釈付けされた。
我々は, GatorTron-large と BERT をエンコーダベースベースライン, GPT-OSS-20B, LLaMA-8B, MedGemma-27B をゼロショットプロンプト, 少数ショットプロンプトで比較した。
GatorTron-largeは最高性能(Micro F1 = 0.62)を達成した。
5発のGPT-OSS-20BとLLaMA-8Bがそれぞれ0.57と0.59のマイクロF1スコアを達成した。
ネガティブ・セルフイメージは高い予測可能性を示し、パーソナライズされたスティグマは最も難しいままであった。
ゼロショット生成推論では、非自明な失敗率(最大32%)を示した。
本研究は,臨床ノートでHIVスティグマを同定するための最初の実用的NLPツールを開発した。
関連論文リスト
- MedArena: Comparing LLMs for Medicine-in-the-Wild Clinician Preferences [50.71326426975699]
MedArenaは医療用大規模言語モデル(LLM)のためのインタラクティブな評価プラットフォームである。
MedArenaは、2つのランダムに選択されたモデルからの応答を表示し、ユーザが好みのレスポンスを選択するように要求する。
2025年11月1日までに12台のLLMで収集された1571の選好のうち、ジェミニ2.0フラッシュシンキング、ジェミニ2.5プロ、GPT-4oがブラッドリー・テリーのレーティングで上位3モデルとなった。
論文 参考訳(メタデータ) (2026-03-13T22:30:26Z) - Fine-Tune, Don't Prompt, Your Language Model to Identify Biased Language in Clinical Notes [31.925112343488976]
臨床的ドキュメンテーションには、感情に満ちた言語が含まれ、無効化や特権化が可能である。
このような言語を検知し分類するためのフレームワークを提案する。
語彙素数入力による微調整は、常にプロンプトアプローチよりも優れていた。
論文 参考訳(メタデータ) (2026-02-16T22:39:28Z) - Multi-Label Classification with Generative AI Models in Healthcare: A Case Study of Suicidality and Risk Factors [9.89999399520808]
本研究では、自殺関連因子(SrFs)の多ラベル分類(MLC)における生成型大規模言語モデル(LLMs)、特にGPT-3.5およびGPT-4.5の使用について検討する。
本稿では,新しいエンドツーエンド生成パイプラインを提案するとともに,ラベルセットレベルのメトリクスや,エラー解析のためのマルチラベル混同行列など,高度な評価手法を提案する。
本研究は,SIとSAの融合などの系統的誤りパターンを明らかにし,ラベル付けに慎重な傾向を示す。
論文 参考訳(メタデータ) (2025-07-22T20:44:44Z) - Application of CARE-SD text classifier tools to assess distribution of stigmatizing and doubt-marking language features in EHR [1.58767962323279]
便秘化言語は, 歴史的に便秘された患者の間で高い速度で発生し, 複数のプロバイダタイプで持続した。
疑わしいマーカーの言語的特徴とMIMIC-III EHRにおけるラベルの分類を行った。
論文 参考訳(メタデータ) (2025-07-11T18:55:28Z) - Suicide Phenotyping from Clinical Notes in Safety-Net Psychiatric Hospital Using Multi-Label Classification with Pre-Trained Language Models [10.384299115679369]
事前訓練された言語モデルは、非構造的な臨床物語から自殺を識別する約束を提供する。
2つの微調整戦略を用いて4つのBERTモデルの性能評価を行った。
その結果, モデル最適化, ドメイン関連データによる事前学習, 単一マルチラベル分類戦略により, 自殺表現のモデル性能が向上することが示唆された。
論文 参考訳(メタデータ) (2024-09-27T16:13:38Z) - Words Matter: Reducing Stigma in Online Conversations about Substance Use with Large Language Models [0.0]
Stigmaは、物質使用障害(SUD)に苦しむ個人に対する治療の障壁である
本研究では、ソーシャルメディア、特にRedditにおいて、匿名性によって差別行動が悪化するおそれのあるスティグマがどのように現れるかを調査する。
論文 参考訳(メタデータ) (2024-08-15T01:00:28Z) - WellDunn: On the Robustness and Explainability of Language Models and Large Language Models in Identifying Wellness Dimensions [46.60244609728416]
言語モデル (LMs) は, 予後不良のリスクが高まれば, 臨床実習におけるモデルの実用性に対するリトマステストにはならない可能性がある, メンタルヘルスの分野では, 言語モデル (LMs) が提案されている。
ウェルネス次元(WD)の同定におけるLMの堅牢性と説明性に着目した評価設計を提案する。
LM/LLMの4つの驚くべき結果が明らかになった。
論文 参考訳(メタデータ) (2024-06-17T19:50:40Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。