論文の概要: Synthetic Time Series Data Generation for Healthcare Applications: A PCG Case Study
- arxiv url: http://arxiv.org/abs/2412.16207v1
- Date: Tue, 17 Dec 2024 18:07:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:55:39.034061
- Title: Synthetic Time Series Data Generation for Healthcare Applications: A PCG Case Study
- Title(参考訳): 医療応用のための合成時系列データ生成:PCGケーススタディ
- Authors: Ainaz Jamshidi, Muhammad Arif, Sabir Ali Kalhoro, Alexander Gelbukh,
- Abstract要約: 我々は、PCGデータを生成するために、最先端の3つの生成モデルを採用し、比較する。
その結果,生成したPCGデータは元のデータセットによく似ていることがわかった。
今後の研究では、この手法をデータ拡張パイプラインに組み込んで、異常なPCG信号を心臓の大腿骨で合成する予定である。
- 参考スコア(独自算出の注目度): 43.28613210217385
- License:
- Abstract: The generation of high-quality medical time series data is essential for advancing healthcare diagnostics and safeguarding patient privacy. Specifically, synthesizing realistic phonocardiogram (PCG) signals offers significant potential as a cost-effective and efficient tool for cardiac disease pre-screening. Despite its potential, the synthesis of PCG signals for this specific application received limited attention in research. In this study, we employ and compare three state-of-the-art generative models from different categories - WaveNet, DoppelGANger, and DiffWave - to generate high-quality PCG data. We use data from the George B. Moody PhysioNet Challenge 2022. Our methods are evaluated using various metrics widely used in the previous literature in the domain of time series data generation, such as mean absolute error and maximum mean discrepancy. Our results demonstrate that the generated PCG data closely resembles the original datasets, indicating the effectiveness of our generative models in producing realistic synthetic PCG data. In our future work, we plan to incorporate this method into a data augmentation pipeline to synthesize abnormal PCG signals with heart murmurs, in order to address the current scarcity of abnormal data. We hope to improve the robustness and accuracy of diagnostic tools in cardiology, enhancing their effectiveness in detecting heart murmurs.
- Abstract(参考訳): 医療診断の進歩と患者のプライバシーの保護には,高品質な医療時系列データの生成が不可欠である。
特に、リアルな心電図(PCG)信号の合成は、心臓疾患前スクリーニングのための費用対効果と効率のよいツールとして有意義な可能性を秘めている。
その可能性にもかかわらず、この特定の用途のためのPCG信号の合成は研究において限られた注目を集めた。
本研究では、ウェーブネット、ドッペルGANger、ディフウェーブの3つの最先端生成モデルを用いて、高品質なPCGデータを生成し、比較する。
私たちはGeorge B. Moody PhysioNet Challenge 2022からのデータを使用します。
提案手法は,平均絶対誤差や平均誤差の最大値といった時系列データ生成領域において,過去の文献で広く用いられている様々な指標を用いて評価される。
以上の結果から,生成したPCGデータは,実際の合成PCGデータ生成における生成モデルの有効性が示唆された。
今後の研究では,この手法をデータ拡張パイプラインに組み込んで,異常なPCG信号を心室で合成し,現在の異常データの不足に対処する計画である。
心臓科における診断ツールの堅牢性と精度を向上し, 心臓大腿骨の検出における有効性の向上を期待する。
関連論文リスト
- Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - CEHR-GPT: Generating Electronic Health Records with Chronological Patient Timelines [14.386260536090628]
我々は合成データ生成に焦点をあて、特定の患者表現を用いてGPTモデルを訓練する能力を実証する。
これにより、観察医療成果パートナーシップ(OMOP)データフォーマットにシームレスに変換できる患者シーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-02-06T20:58:36Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Multi-Label Clinical Time-Series Generation via Conditional GAN [23.380183382491495]
MTGAN(Multi-label Time-Series GAN)を用いて,EMHデータと不均衡な疾患を生成する。
批評家はワッサースタイン距離を用いてスコアを与え、データと時間的特徴の両方を考慮することで、合成サンプルから実際のサンプルを認識する。
実験により, MTGANの合成データの品質と実効性を示す。
論文 参考訳(メタデータ) (2022-04-10T23:30:07Z) - Synthetic ECG Signal Generation Using Generative Neural Networks [7.122393663641668]
本研究は,GAN(Generative Adversarial Network)ファミリーから5つの異なるモデルの合成ECG生成能力について検討した。
以上の結果から, 全ての実験モデルにおいて, 形態学的特徴に高い類似性を有する許容心拍の大量生成に成功できることが示唆された。
論文 参考訳(メタデータ) (2021-12-05T20:28:55Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - Training neural networks with synthetic electrocardiograms [3.1583465114791105]
本稿では,ウェアラブル型単一リード心電図モニターによって生成された信号を模倣する合成心電図を用いたニューラルネットワークのトレーニング手法を提案する。
トレーニング例毎に波形形状,RR間隔,雑音などの合成信号特性が変化する領域ランダム化を用いる。
合成データで訓練されたモデルは、実際のデータで訓練されたモデルと比較される。
実験では、異なるシードで堅牢なパフォーマンスを示し、テストセット固有のチューニングなしで異なるテストセットでトレーニング例を示します。
論文 参考訳(メタデータ) (2021-11-11T12:39:33Z) - Improving the efficacy of Deep Learning models for Heart Beat detection
on heterogeneous datasets [0.0]
ヘテロジニアスデータセットにディープラーニングモデルを適用する際の問題点について検討する。
本研究では,健常者からのデータに基づいてトレーニングしたモデルの性能が,心疾患患者に適用した場合に低下することを示す。
次に、異なるデータセットにモデルを適応させるためのTransfer Learningの使用を評価します。
論文 参考訳(メタデータ) (2021-10-26T14:26:55Z) - Label scarcity in biomedicine: Data-rich latent factor discovery
enhances phenotype prediction [102.23901690661916]
低次元の埋め込み空間は、健康指標、ライフスタイル、および人口動態の予測をデータスカース化するために、英国バイオバンクの人口データセットから導出することができる。
半超越的アプローチによるパフォーマンス向上は、おそらく様々な医学データサイエンス応用にとって重要な要素となるだろう。
論文 参考訳(メタデータ) (2021-10-12T16:25:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。