論文の概要: README: Bridging Medical Jargon and Lay Understanding for Patient
Education through Data-Centric NLP
- arxiv url: http://arxiv.org/abs/2312.15561v1
- Date: Sun, 24 Dec 2023 23:01:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 17:42:04.856863
- Title: README: Bridging Medical Jargon and Lay Understanding for Patient
Education through Data-Centric NLP
- Title(参考訳): README:データ中心NLPによる医療ジャーゴンのブリッジと患者教育への理解
- Authors: Zonghai Yao, Nandyala Siddharth Kantu, Guanghao Wei, Hieu Tran,
Zhangqi Duan, Sunjae Kwon, Zhichao Yang, README annotation team, Hong Yu
- Abstract要約: 医療用語を患者に親しみやすい平易な言語に簡略化することを目的とした,レイ定義の自動生成という新たなタスクを導入する。
私たちはまず、2万以上のユニークな医療用語と30万件の言及からなるデータセットを作成しました。
また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。
- 参考スコア(独自算出の注目度): 9.746045026596638
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The advancement in healthcare has shifted focus toward patient-centric
approaches, particularly in self-care and patient education, facilitated by
access to Electronic Health Records (EHR). However, medical jargon in EHRs
poses significant challenges in patient comprehension. To address this, we
introduce a new task of automatically generating lay definitions, aiming to
simplify complex medical terms into patient-friendly lay language. We first
created the README dataset, an extensive collection of over 20,000 unique
medical terms and 300,000 mentions, each offering context-aware lay definitions
manually annotated by domain experts. We have also engineered a data-centric
Human-AI pipeline that synergizes data filtering, augmentation, and selection
to improve data quality. We then used README as the training data for models
and leveraged a Retrieval-Augmented Generation (RAG) method to reduce
hallucinations and improve the quality of model outputs. Our extensive
automatic and human evaluations demonstrate that open-source mobile-friendly
models, when fine-tuned with high-quality data, are capable of matching or even
surpassing the performance of state-of-the-art closed-source large language
models like ChatGPT. This research represents a significant stride in closing
the knowledge gap in patient education and advancing patient-centric healthcare
solutions
- Abstract(参考訳): 医療の進歩は患者中心のアプローチ、特にElectronic Health Records(EHR)へのアクセスによって促進されるセルフケアと患者教育に焦点を移している。
しかし, EHRの医療ジャーゴンは, 患者の理解に重大な課題をもたらす。
そこで我々は,複雑な医療用語を患者フレンドリーなレイ言語に単純化することを目的とした,レイ定義の自動生成タスクを提案する。
readmeデータセットは、2万以上のユニークな医療用語と30万の言及の広範なコレクションで、それぞれがドメインの専門家によって手作業でアノテートされたコンテキスト対応のレイアウト定義を提供しています。
また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。
次に,モデルの学習データとしてreadmeを使用し,探索型生成(rag)法を用いて幻覚を低減し,モデル出力の質を向上させる。
当社の広範な自動評価と人間による評価は、高品質なデータで微調整されたオープンソースのモバイルフレンドリーなモデルは、chatgptのような最先端のクローズドソースの大規模言語モデルのパフォーマンスにマッチする、あるいは超えていることを示している。
この研究は、患者教育における知識ギャップの解消と患者中心の医療ソリューションの進歩における重要な一歩である。
関連論文リスト
- Zero-shot and Few-shot Generation Strategies for Artificial Clinical Records [1.338174941551702]
本研究は,Llama 2 LLMが患者情報を正確に反映した合成医療記録を作成する能力を評価するものである。
筆者らは,MIMIC-IVデータセットから得られたデータを用いて,現在史の物語を生成することに重点を置いている。
このチェーン・オブ・シークレットのアプローチにより、ゼロショットモデルが、ルージュのメトリクス評価に基づいて、微調整されたモデルと同等の結果が得られることが示唆された。
論文 参考訳(メタデータ) (2024-03-13T16:17:09Z) - Recent Advances in Predictive Modeling with Electronic Health Records [73.31880579203012]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - Data-Centric Foundation Models in Computational Healthcare: A Survey [22.459507690070463]
AI技術の新たなスイートとしてのファンデーションモデル(FM)は、計算医療の波を巻き起こしている。
我々は、AIセキュリティ、アセスメント、および人間の価値との整合性における重要な視点について議論する。
本報告では,患者の予後と臨床ワークフローを向上するために,FMベースの分析を期待できる展望を提供する。
論文 参考訳(メタデータ) (2024-01-04T08:00:32Z) - LLMs Accelerate Annotation for Medical Information Extraction [7.743388571513413]
本稿では,LLM(Large Language Models)と人間の専門知識を組み合わせた手法を提案する。
医療情報抽出タスクにおいて,我々の手法を厳格に評価し,我々のアプローチが人的介入を大幅に削減するだけでなく,高い精度を維持していることを示す。
論文 参考訳(メタデータ) (2023-12-04T19:26:13Z) - PULSAR: Pre-training with Extracted Healthcare Terms for Summarising
Patients' Problems and Data Augmentation with Black-box Large Language Models [25.363775123262307]
問題リストの形で患者の問題を自動的に要約することで、ステークホルダーが患者の状態を理解し、作業負荷と認知バイアスを減らすのに役立つ。
BioNLP 2023 共有タスク1Aは、入院中の提供者の進捗状況から診断と問題のリストを作成することに焦点を当てている。
1つのコンポーネントは、データ拡張のために大きな言語モデル(LLM)を使用し、もう1つは、リストとして要約された患者の問題を生成するための、新しいトレーニング済みの目標を持つ抽象的な要約 LLM である。
私たちのアプローチは、共有タスクへの全提出のうち、第2位でした。
論文 参考訳(メタデータ) (2023-06-05T10:17:50Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - A Deep Learning Pipeline for Patient Diagnosis Prediction Using
Electronic Health Records [0.5672132510411464]
我々は、公衆衛生データセットを普遍的なフォーマットに容易に変換するPythonパッケージを開発し、公開する。
複数の診断を同時に予測する2つの新しいモデルアーキテクチャを提案する。
どちらのモデルも高い精度で複数の診断を同時に予測できる。
論文 参考訳(メタデータ) (2020-06-23T14:58:58Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。