論文の概要: Enhancing Clinical Documentation with Synthetic Data: Leveraging Generative Models for Improved Accuracy
- arxiv url: http://arxiv.org/abs/2406.06569v1
- Date: Mon, 3 Jun 2024 15:49:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-17 00:04:06.917049
- Title: Enhancing Clinical Documentation with Synthetic Data: Leveraging Generative Models for Improved Accuracy
- Title(参考訳): 合成データによる臨床ドキュメンテーションの強化:精度向上のための生成モデルを活用する
- Authors: Anjanava Biswas, Wrick Talukdar,
- Abstract要約: 本稿では, 合成データ生成技術を活用した新たな臨床文書作成手法を提案する。
本稿では,GAN (Generative Adrial Networks) やVAE (variantal Autoencoders) など,最先端の生成モデルを組み合わせた方法論を提案する。
実世界のデータによく似た高品質な合成文字を生成する上で,本手法の有効性を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accurate and comprehensive clinical documentation is crucial for delivering high-quality healthcare, facilitating effective communication among providers, and ensuring compliance with regulatory requirements. However, manual transcription and data entry processes can be time-consuming, error-prone, and susceptible to inconsistencies, leading to incomplete or inaccurate medical records. This paper proposes a novel approach to augment clinical documentation by leveraging synthetic data generation techniques to generate realistic and diverse clinical transcripts. We present a methodology that combines state-of-the-art generative models, such as Generative Adversarial Networks (GANs) and Variational Autoencoders (VAEs), with real-world clinical transcript and other forms of clinical data to generate synthetic transcripts. These synthetic transcripts can then be used to supplement existing documentation workflows, providing additional training data for natural language processing models and enabling more accurate and efficient transcription processes. Through extensive experiments on a large dataset of anonymized clinical transcripts, we demonstrate the effectiveness of our approach in generating high-quality synthetic transcripts that closely resemble real-world data. Quantitative evaluation metrics, including perplexity scores and BLEU scores, as well as qualitative assessments by domain experts, validate the fidelity and utility of the generated synthetic transcripts. Our findings highlight synthetic data generation's potential to address clinical documentation challenges, improving patient care, reducing administrative burdens, and enhancing healthcare system efficiency.
- Abstract(参考訳): 正確かつ包括的な臨床文書は、高品質な医療の提供、提供者間の効果的なコミュニケーションの促進、規制要件の遵守の確保に不可欠である。
しかし、手動による書き起こしとデータ入力のプロセスは、時間がかかり、エラーが発生し、不整合に陥り、不完全または不正確な医療記録に繋がる。
本稿では, 臨床文書の現実的, 多様な書式を生成するために, 合成データ生成技術を活用することによって, 臨床文書の充実に向けた新たなアプローチを提案する。
本稿では,GAN (Generative Adversarial Networks) やVAE (variantal Autoencoders) といった最先端のジェネレーティブ・モデルと,実際の臨床転写とその他の臨床データを組み合わせて合成転写を生成する手法を提案する。
これらの合成写本は、既存のドキュメントワークフローを補完し、自然言語処理モデルのための追加のトレーニングデータを提供し、より正確で効率的な転写プロセスを可能にするために使用することができる。
匿名化クリニカル・トランスクリプトの大規模なデータセットに関する広範な実験を通じて、実世界のデータによく似た高品質な合成・トランスクリプトを作成する上で、我々のアプローチの有効性を実証した。
パープレキシティスコアやBLEUスコア、ドメインの専門家による質的評価などの定量的評価指標は、生成された合成転写産物の忠実さと有用性を検証する。
本研究は, 患者医療の改善, 管理負担の軽減, 医療システム効率の向上など, 臨床ドキュメントの課題に対処する合成データ生成の可能性を明らかにするものである。
関連論文リスト
- SynRL: Aligning Synthetic Clinical Trial Data with Human-preferred Clinical Endpoints Using Reinforcement Learning [23.643984146939573]
患者データ生成装置の性能向上のために強化学習を活用するSynRLを提案する。
提案手法は,生成したデータの品質を評価するためのデータ値批判機能と,データジェネレータとユーザニーズを整合させる強化学習を利用する。
論文 参考訳(メタデータ) (2024-11-11T19:19:46Z) - Synthetic4Health: Generating Annotated Synthetic Clinical Letters [6.822926897514792]
臨床手紙には機密情報が含まれているため、モデルトレーニング、医学研究、教育には臨床関連データセットが広く適用できない。
本研究は, 信頼性, 各種, 未同定の総合臨床書面を生成することを目的としている。
論文 参考訳(メタデータ) (2024-09-14T18:15:07Z) - Improving Extraction of Clinical Event Contextual Properties from Electronic Health Records: A Comparative Study [2.0884301753594334]
本研究は,医学テキスト分類のための様々な自然言語モデルの比較分析を行う。
BERTはBi-LSTMモデルを最大28%、ベースラインのBERTモデルを最大16%上回り、マイノリティクラスをリコールする。
論文 参考訳(メタデータ) (2024-08-30T10:28:49Z) - TRIALSCOPE: A Unifying Causal Framework for Scaling Real-World Evidence
Generation with Biomedical Language Models [22.046231408373522]
観測データから実世界の証拠を抽出する統合フレームワークであるTRIALSCOPEについて述べる。
TRIALSCOPEは実世界のデータの高品質な構造化を可能とし,マーキーがん検診に匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2023-11-02T15:15:47Z) - Knowledge-Infused Prompting: Assessing and Advancing Clinical Text Data
Generation with Large Language Models [48.07083163501746]
臨床自然言語処理には、ドメイン固有の課題に対処できる方法が必要である。
我々は,そのプロセスに知識を注入する,革新的で資源効率のよいアプローチであるClinGenを提案する。
7つのNLPタスクと16のデータセットを比較検討した結果,ClinGenはさまざまなタスクのパフォーマンスを継続的に向上させることがわかった。
論文 参考訳(メタデータ) (2023-11-01T04:37:28Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Medical Scientific Table-to-Text Generation with Human-in-the-Loop under
the Data Sparsity Constraint [11.720364723821993]
効率的なテーブル・ツー・テキスト要約システムは、このデータをレポートにまとめる手作業を大幅に減らすことができる。
しかし、実際には、この問題は、正確で信頼性の高い出力を生成するための最先端の自然言語生成モデルの、データポーカリティ、データポーサリティ、および機能不全によって大きく妨げられている。
本稿では, 自動補正, コピー機構, 合成データ拡張によって強化された新しい2段階アーキテクチャを用いて, テーブル・ツー・テキスト・アプローチを提案し, それらの課題に対処する。
論文 参考訳(メタデータ) (2022-05-24T21:10:57Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Benchmarking Automated Clinical Language Simplification: Dataset,
Algorithm, and Evaluation [48.87254340298189]
我々はMedLaneという名の新しいデータセットを構築し、自動化された臨床言語簡易化手法の開発と評価を支援する。
我々は,人間のアノテーションの手順に従い,最先端のパフォーマンスを実現するDECLAREと呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-12-04T06:09:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。