論文の概要: A Dataset and Resources for Identifying Patient Health Literacy Information from Clinical Notes
- arxiv url: http://arxiv.org/abs/2603.19082v1
- Date: Thu, 19 Mar 2026 16:09:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.252473
- Title: A Dataset and Resources for Identifying Patient Health Literacy Information from Clinical Notes
- Title(参考訳): 臨床ノートから患者の健康リテラシー情報を特定するためのデータセットとリソース
- Authors: Madeline Bittner, Dina Demner-Fushman, Yasmeen Shabazz, Davis Bartels, Dukyong Yoon, Brad Quitadamo, Rajiv Menghrajani, Leo Celi, Sarvesh Soni,
- Abstract要約: HEALIXは,臨床論文から得られた最初の公衆衛生リテラシーデータセットである。
HEALIXには、9つのノートタイプに589のノートがあり、3つの健康リテラシーラベル(低、正常、高)が注釈付けされている。
- 参考スコア(独自算出の注目度): 5.728125792438942
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Health literacy is a critical determinant of patient outcomes, yet current screening tools are not always feasible and differ considerably in the number of items, question format, and dimensions of health literacy they capture, making documentation in structured electronic health records difficult to achieve. Automated detection from unstructured clinical notes offers a promising alternative, as these notes often contain richer, more contextual health literacy information, but progress has been limited by the lack of annotated resources. We introduce HEALIX, the first publicly available annotated health literacy dataset derived from real clinical notes, curated through a combination of social worker note sampling, keyword-based filtering, and LLM-based active learning. HEALIX contains 589 notes across 9 note types, annotated with three health literacy labels: low, normal, and high. To demonstrate its utility, we benchmarked zero-shot and few-shot prompting strategies across four open source large language models (LLMs).
- Abstract(参考訳): 健康リテラシーは患者の成果を決定づける重要な要因であるが、現在のスクリーニングツールは必ずしも実現可能ではなく、取得した健康リテラシーの項目数、質問形式、寸法で大きく異なるため、構造化された電子健康記録の文書化が困難である。
構造化されていない臨床ノートからの自動検出は有望な代替手段であり、これらのノートにはより豊かで文脈的な健康リテラシー情報が含まれることが多いが、注釈付きリソースの欠如によって進歩は制限されている。
HEALIXは,ソーシャルワーカーノートのサンプリング,キーワードベースのフィルタリング,LDMに基づくアクティブラーニングの組み合わせにより,実際の臨床論文から得られた,初めて公開されている健康リテラシーデータセットである。
HEALIXには、9つのノートタイプに589のノートがあり、3つの健康リテラシーラベル(低、正常、高)が注釈付けされている。
その実用性を実証するため、我々は4つのオープンソース大規模言語モデル(LLM)のゼロショットと少数ショットのプロンプト戦略をベンチマークした。
関連論文リスト
- Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。
本稿では,構造化医療推論を利用した新しいアプローチを提案する。
我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文 参考訳(メタデータ) (2025-03-05T05:24:55Z) - Large Language Models for Healthcare Text Classification: A Systematic Review [4.8342038441006805]
大規模言語モデル(LLM)は、自然言語処理(NLP)のアプローチを根本的に変えた。
医療分野では、臨床ノートの分析、診断コーディング、その他のタスクにおいて、正確で費用効率のよいテキスト分類が不可欠である。
医療用テキストの自動分類にLLMを活用するために多くの研究がなされている。
論文 参考訳(メタデータ) (2025-03-03T04:16:13Z) - Improving Clinical Note Generation from Complex Doctor-Patient Conversation [20.2157016701399]
大言語モデル(LLM)を用いた臨床ノート作成分野への3つの重要な貢献について述べる。
まず、CliniKnoteを紹介します。CliniKnoteは、1200の複雑な医師と患者との会話と、その全臨床ノートを組み合わせたデータセットです。
第2に,従来のSOAPcitepodder20soap(Subjective, Objective, Assessment, Plan)のメモを上位にキーワードセクションを追加することで,必須情報の迅速な識別を可能にするK-SOAPを提案する。
第3に、医師と患者との会話からK-SOAPノートを生成する自動パイプラインを開発し、様々な近代LCMをベンチマークする。
論文 参考訳(メタデータ) (2024-08-26T18:39:31Z) - A Hybrid Framework with Large Language Models for Rare Disease Phenotyping [4.550497164299771]
希少な疾患は、その頻度が低く、異質な臨床的プレゼンテーションのため、診断と治療において重大な課題となる。
本研究では,辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを開発することを目的とする。
本稿では,Orphanet Rare Disease Ontology (ORDO) とUnified Medical Language System (UMLS) を統合した新たなハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-16T20:59:28Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Question-Answering System Extracts Information on Injection Drug Use
from Clinical Notes [4.537953996010351]
注射薬の使用(IDU)は、死亡率と死亡率を高める危険な健康行動である。
IDU情報を表示する唯一の場所は、構造化されていないフリーテキスト臨床ノートである。
臨床ノートからIDUに関する情報を抽出するための質問応答(QA)フレームワークを設計し,実証する。
論文 参考訳(メタデータ) (2023-05-15T16:37:00Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。