Fugu-MT 論文翻訳(概要): README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP

論文の概要: README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP

arxiv url: http://arxiv.org/abs/2312.15561v1
Date: Sun, 24 Dec 2023 23:01:00 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-27 17:42:04.856863
Title: README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP
Title（参考訳）: README:データ中心NLPによる医療ジャーゴンのブリッジと患者教育への理解
Authors: Zonghai Yao, Nandyala Siddharth Kantu, Guanghao Wei, Hieu Tran, Zhangqi Duan, Sunjae Kwon, Zhichao Yang, README annotation team, Hong Yu
Abstract要約: 医療用語を患者に親しみやすい平易な言語に簡略化することを目的とした,レイ定義の自動生成という新たなタスクを導入する。私たちはまず、2万以上のユニークな医療用語と30万件の言及からなるデータセットを作成しました。また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。
参考スコア（独自算出の注目度）: 9.746045026596638
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The advancement in healthcare has shifted focus toward patient-centric approaches, particularly in self-care and patient education, facilitated by access to Electronic Health Records (EHR). However, medical jargon in EHRs poses significant challenges in patient comprehension. To address this, we introduce a new task of automatically generating lay definitions, aiming to simplify complex medical terms into patient-friendly lay language. We first created the README dataset, an extensive collection of over 20,000 unique medical terms and 300,000 mentions, each offering context-aware lay definitions manually annotated by domain experts. We have also engineered a data-centric Human-AI pipeline that synergizes data filtering, augmentation, and selection to improve data quality. We then used README as the training data for models and leveraged a Retrieval-Augmented Generation (RAG) method to reduce hallucinations and improve the quality of model outputs. Our extensive automatic and human evaluations demonstrate that open-source mobile-friendly models, when fine-tuned with high-quality data, are capable of matching or even surpassing the performance of state-of-the-art closed-source large language models like ChatGPT. This research represents a significant stride in closing the knowledge gap in patient education and advancing patient-centric healthcare solutions
Abstract（参考訳）: 医療の進歩は患者中心のアプローチ、特にElectronic Health Records(EHR)へのアクセスによって促進されるセルフケアと患者教育に焦点を移している。しかし, EHRの医療ジャーゴンは, 患者の理解に重大な課題をもたらす。そこで我々は,複雑な医療用語を患者フレンドリーなレイ言語に単純化することを目的とした,レイ定義の自動生成タスクを提案する。 readmeデータセットは、2万以上のユニークな医療用語と30万の言及の広範なコレクションで、それぞれがドメインの専門家によって手作業でアノテートされたコンテキスト対応のレイアウト定義を提供しています。また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。次に,モデルの学習データとしてreadmeを使用し,探索型生成(rag)法を用いて幻覚を低減し,モデル出力の質を向上させる。当社の広範な自動評価と人間による評価は、高品質なデータで微調整されたオープンソースのモバイルフレンドリーなモデルは、chatgptのような最先端のクローズドソースの大規模言語モデルのパフォーマンスにマッチする、あるいは超えていることを示している。この研究は、患者教育における知識ギャップの解消と患者中心の医療ソリューションの進歩における重要な一歩である。

関連論文リスト

Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文参考訳（メタデータ） (2025-10-24T15:56:40Z)
Extracting OPQRST in Electronic Health Records using Large Language Models with Reasoning [3.486461799078777]
本稿では,Large Language Models (LLM) の機能を活用して,EHRからOPQRSTアセスメントを抽出するための新しいアプローチを提案する。本稿では,医師の認知過程を模倣する推論ステップをモデルに提供できるように,シーケンスラベリングからテキスト生成へタスクを再構成することを提案する。当社のコントリビューションは、医療におけるAIの利用の大幅な進歩を示し、EHRからの情報抽出の正確性とユーザビリティを向上させるスケーラブルなソリューションを提供しています。
論文参考訳（メタデータ） (2025-09-02T02:21:02Z)
A Large-Scale Vision-Language Dataset Derived from Open Scientific Literature to Advance Biomedical Generalist AI [70.06771291117965]
PubMed Central Open Accessサブセットから派生したオープンソースのデータセットであるBiomedicaを紹介する。 Biomedicaには600万以上の科学論文と2400万の画像テキストペアが含まれている。私たちは、Webサーバを通じてスケーラブルなストリーミングと検索APIを提供し、AIシステムとのシームレスな統合を容易にします。
論文参考訳（メタデータ） (2025-03-26T05:56:46Z)
Speaking the Same Language: Leveraging LLMs in Standardizing Clinical Data for AI [0.0]
本研究は、医療データの標準化など、特定の課題に対処するため、大規模言語モデルの採用を念頭においている。この結果から,大規模言語モデルを用いることで手作業によるデータキュレーションの必要性が著しく低下することが示唆された。提案手法は、医療におけるAIの統合を迅速化し、患者のケアの質を向上させるとともに、AIのためのデータ作成に必要な時間と資金を最小化する。
論文参考訳（メタデータ） (2024-08-16T20:51:21Z)
STLLaVA-Med: Self-Training Large Language and Vision Assistant for Medical Question-Answering [58.79671189792399]
STLLaVA-Medは、医療ビジュアルインストラクションデータを自動生成できるポリシーモデルを訓練するために設計されている。 STLLaVA-Medの有効性とデータ効率を3つの主要な医用視覚質問応答(VQA)ベンチマークで検証した。
論文参考訳（メタデータ） (2024-06-28T15:01:23Z)
GAMedX: Generative AI-based Medical Entity Data Extractor Using Large Language Models [1.123722364748134]
本稿では,Large Language Models(LLMs)を利用した名前付きエンティティ認識(NER)アプローチであるGAMedXを紹介する。この方法論は、NERのためのオープンソースのLCMを統合し、特殊な医学用語の複雑さをナビゲートするために、連鎖プロンプトとピダンティックスキーマを構造化出力に利用している。その結果, 評価データセットの1つに対して, 98%の精度でROUGE F1の有意なスコアが得られた。
論文参考訳（メタデータ） (2024-05-31T02:53:22Z)
Recent Advances in Predictive Modeling with Electronic Health Records [71.19967863320647]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。深層学習は、医療を含む様々な応用においてその優位性を示している。
論文参考訳（メタデータ） (2024-02-02T00:31:01Z)
Data-Centric Foundation Models in Computational Healthcare: A Survey [21.53211505568379]
AI技術の新たなスイートとしてのファンデーションモデル(FM)は、計算医療の波を巻き起こしている。我々は、AIセキュリティ、アセスメント、および人間の価値との整合性における重要な視点について議論する。本報告では,患者の予後と臨床ワークフローを向上するために,FMベースの分析を期待できる展望を提供する。
論文参考訳（メタデータ） (2024-01-04T08:00:32Z)
LLMs Accelerate Annotation for Medical Information Extraction [7.743388571513413]
本稿では,LLM(Large Language Models)と人間の専門知識を組み合わせた手法を提案する。医療情報抽出タスクにおいて,我々の手法を厳格に評価し,我々のアプローチが人的介入を大幅に削減するだけでなく,高い精度を維持していることを示す。
論文参考訳（メタデータ） (2023-12-04T19:26:13Z)
PULSAR: Pre-training with Extracted Healthcare Terms for Summarising Patients' Problems and Data Augmentation with Black-box Large Language Models [25.363775123262307]
問題リストの形で患者の問題を自動的に要約することで、ステークホルダーが患者の状態を理解し、作業負荷と認知バイアスを減らすのに役立つ。 BioNLP 2023 共有タスク1Aは、入院中の提供者の進捗状況から診断と問題のリストを作成することに焦点を当てている。 1つのコンポーネントは、データ拡張のために大きな言語モデル(LLM)を使用し、もう1つは、リストとして要約された患者の問題を生成するための、新しいトレーニング済みの目標を持つ抽象的な要約 LLM である。私たちのアプローチは、共有タスクへの全提出のうち、第2位でした。
論文参考訳（メタデータ） (2023-06-05T10:17:50Z)
Large Language Models for Healthcare Data Augmentation: An Example on Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文参考訳（メタデータ） (2023-03-24T03:14:00Z)
Towards more patient friendly clinical notes through language models and ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文参考訳（メタデータ） (2021-12-23T16:11:19Z)
MIMO: Mutual Integration of Patient Journey and Medical Ontology for Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文参考訳（メタデータ） (2021-07-20T07:04:52Z)
BiteNet: Bidirectional Temporal Encoder Network to Predict Medical Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文参考訳（メタデータ） (2020-09-24T00:42:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。