Fugu-MT 論文翻訳(概要): In-Context Learning for Preserving Patient Privacy: A Framework for Synthesizing Realistic Patient Portal Messages

論文の概要: In-Context Learning for Preserving Patient Privacy: A Framework for Synthesizing Realistic Patient Portal Messages

arxiv url: http://arxiv.org/abs/2411.06549v1
Date: Sun, 10 Nov 2024 18:06:55 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:46.266318
Title: In-Context Learning for Preserving Patient Privacy: A Framework for Synthesizing Realistic Patient Portal Messages
Title（参考訳）: 患者プライバシ保護のためのインコンテキストラーニング:リアルな患者ポータルメッセージを合成するためのフレームワーク
Authors: Joseph Gatto, Parker Seegmiller, Timothy E. Burdick, Sarah Masud Preum,
Abstract要約: 新型コロナウイルス(COVID-19)のパンデミック以降、臨床医は患者のポータルメッセージに大きくて持続的な流入を見てきた。本研究では,現実的な患者ポータルメッセージ生成のための LLM を利用したフレームワークを提案する。
参考スコア（独自算出の注目度）: 0.9112162560071937
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Since the COVID-19 pandemic, clinicians have seen a large and sustained influx in patient portal messages, significantly contributing to clinician burnout. To the best of our knowledge, there are no large-scale public patient portal messages corpora researchers can use to build tools to optimize clinician portal workflows. Informed by our ongoing work with a regional hospital, this study introduces an LLM-powered framework for configurable and realistic patient portal message generation. Our approach leverages few-shot grounded text generation, requiring only a small number of de-identified patient portal messages to help LLMs better match the true style and tone of real data. Clinical experts in our team deem this framework as HIPAA-friendly, unlike existing privacy-preserving approaches to synthetic text generation which cannot guarantee all sensitive attributes will be protected. Through extensive quantitative and human evaluation, we show that our framework produces data of higher quality than comparable generation methods as well as all related datasets. We believe this work provides a path forward for (i) the release of large-scale synthetic patient message datasets that are stylistically similar to ground-truth samples and (ii) HIPAA-friendly data generation which requires minimal human de-identification efforts.
Abstract（参考訳）: 新型コロナウイルス(COVID-19)のパンデミック以降、臨床医は患者のポータルメッセージが大量に流入し、臨床医の燃え尽きに大きく貢献している。私たちの知る限りでは、コーポラ研究者が臨床のポータルワークフローを最適化するためのツールを構築するために使用できる、大規模な患者ポータルメッセージはありません。本研究は, 地域病院と共同で実施している取り組みを参考に, LLMを利用した患者ポータルメッセージ生成のためのフレームワークを提案する。提案手法では,LLMの真のスタイルやトーンに適合するために,少数の非識別患者ポータルメッセージしか必要としない。私たちのチームの臨床専門家は、このフレームワークをHIPAAフレンドリとみなしています。定量的および人的評価を通じて、我々のフレームワークは、同等の生成方法と関連するすべてのデータセットよりも高品質なデータを生成することを示す。私たちはこの研究が前進の道をもたらすと信じています一地上真実のサンプルとスタイリスティックに類似した大規模合成患者メッセージデータセットの公開 (II)人間識別の最小化を必要とするHIPAAフレンドリーなデータ生成。

関連論文リスト

Patient-Zero: A Unified Framework for Real-Record-Free Patient Agent Generation [11.75912414451272]
実際の医療記録を必要としない現実的な患者生成フレームワークであるPatent-Zeroを提案する。 patient-Zeroはまず、医療に整合したマルチステップ生成アーキテクチャを導入し、実際の医療記録を使わずに階層的な医療知識注入を通じて包括的な患者記録を構築する。本フレームワークは,適応的対話戦略とリアルタイム臨床的妥当性検証によって支援され,厳密な医療コヒーレンスを維持しつつ,文脈的に多様な患者記録の生成を可能にする。
論文参考訳（メタデータ） (2025-09-14T03:56:00Z)
SynLLM: A Comparative Analysis of Large Language Models for Medical Tabular Synthetic Data Generation via Prompt Engineering [1.5020330976600738]
オープンソースのLarge Language Modelsを用いて高品質な合成医療データを生成するためのモジュラーフレームワークであるSynLLMを提案する。 SynLLMは糖尿病, 硬変, ストロークを含む3つの公的医療データセットで評価した。以上の結果から,プロンプトエンジニアリングがデータ品質とプライバシリスクに大きく影響し,ルールベースのプロンプトが最高のプライバシ品質バランスを達成することが示唆された。
論文参考訳（メタデータ） (2025-08-11T23:56:42Z)
A Case Study Exploring the Current Landscape of Synthetic Medical Record Generation with Commercial LLMs [1.1645633237702129]
合成データを生成する商用大規模言語モデルの現状を評価する。我々の主な発見は、LLMが小さな特徴のサブセットに対して確実に合成された健康記録を生成できる一方で、データの次元が増加するにつれて、現実的な分布と相関を維持するのに苦労していることである。
論文参考訳（メタデータ） (2025-04-20T15:37:05Z)
A text-to-tabular approach to generate synthetic patient data using LLMs [0.3628457733531155]
そこで本研究では,患者データへのアクセスを必要としない人工的な患者データを生成する手法を提案する。我々は,大言語モデルの先行医療知識とコンテキスト内学習能力を活用して,現実的な患者データを生成する。
論文参考訳（メタデータ） (2024-12-06T16:10:40Z)
Zero-shot and Few-shot Generation Strategies for Artificial Clinical Records [1.338174941551702]
本研究は,Llama 2 LLMが患者情報を正確に反映した合成医療記録を作成する能力を評価するものである。筆者らは,MIMIC-IVデータセットから得られたデータを用いて,現在史の物語を生成することに重点を置いている。このチェーン・オブ・シークレットのアプローチにより、ゼロショットモデルが、ルージュのメトリクス評価に基づいて、微調整されたモデルと同等の結果が得られることが示唆された。
論文参考訳（メタデータ） (2024-03-13T16:17:09Z)
NOTE: Notable generation Of patient Text summaries through Efficient approach based on direct preference optimization [0.0]
NOTE」は「直接選好最適化に基づく効率的なアプローチによる患者テキスト要約の不適切な生成」の意。患者イベントは順次組み合わせられ、各入院の退院の概要を生成するために使用される。ノートは、サマリーを放出するだけでなく、患者の旅行を通して様々なサマリーを生成するために利用することができる。
論文参考訳（メタデータ） (2024-02-19T06:43:25Z)
AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文参考訳（メタデータ） (2024-02-15T06:46:48Z)
README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP [9.432205523734707]
医療用語を患者に親しみやすい平易な言語に簡略化することを目的とした,レイ定義の自動生成という新たなタスクを導入する。このデータセットは、5万以上のユニークな(医療用語、日常の定義)ペアと30万の言及からなる。また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。
論文参考訳（メタデータ） (2023-12-24T23:01:00Z)
LLMs Accelerate Annotation for Medical Information Extraction [7.743388571513413]
本稿では,LLM(Large Language Models)と人間の専門知識を組み合わせた手法を提案する。医療情報抽出タスクにおいて,我々の手法を厳格に評価し,我々のアプローチが人的介入を大幅に削減するだけでなく,高い精度を維持していることを示す。
論文参考訳（メタデータ） (2023-12-04T19:26:13Z)
Knowledge-Infused Prompting: Assessing and Advancing Clinical Text Data Generation with Large Language Models [48.07083163501746]
臨床自然言語処理には、ドメイン固有の課題に対処できる方法が必要である。我々は,そのプロセスに知識を注入する,革新的で資源効率のよいアプローチであるClinGenを提案する。 7つのNLPタスクと16のデータセットを比較検討した結果,ClinGenはさまざまなタスクのパフォーマンスを継続的に向上させることがわかった。
論文参考訳（メタデータ） (2023-11-01T04:37:28Z)
PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。提案手法は画像とテキストデータを融合して生成プロセスを強化する。我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文参考訳（メタデータ） (2023-09-01T22:08:32Z)
Large Language Models for Healthcare Data Augmentation: An Example on Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文参考訳（メタデータ） (2023-03-24T03:14:00Z)
Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。提案手法により,下流タスクの性能が大幅に向上した。
論文参考訳（メタデータ） (2023-03-08T03:56:31Z)
Towards more patient friendly clinical notes through language models and ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文参考訳（メタデータ） (2021-12-23T16:11:19Z)
FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。患者のプライバシー上の懸念から、データそのものはまだ乏しい。我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文参考訳（メタデータ） (2021-02-10T01:56:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。