論文の概要: A Reinforcement Learning Approach to Synthetic Data Generation
- arxiv url: http://arxiv.org/abs/2512.21395v1
- Date: Wed, 24 Dec 2025 19:26:37 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 11:59:11.326891
- Title: A Reinforcement Learning Approach to Synthetic Data Generation
- Title(参考訳): 合成データ生成のための強化学習アプローチ
- Authors: Natalia Espinosa-Dice, Nicholas J. Jackson, Chao Yan, Aaron Lee, Bradley A. Malin,
- Abstract要約: RLSynは患者記録に対するポリシーとしてデータジェネレータをモデル化する新しいフレームワークである。
我々は、プライバシー、実用性、忠実度を評価する上で、最先端のジェネレーティブ・敵ネットワーク(GAN)と拡散に基づく手法を比較検討した。
- 参考スコア(独自算出の注目度): 8.293402602656736
- License:
- Abstract: Synthetic data generation (SDG) is a promising approach for enabling data sharing in biomedical studies while preserving patient privacy. Yet, state-of-the-art generative models often require large datasets and complex training procedures, limiting their applicability in small-sample settings. In this work, we reframe SDG as a reinforcement learning (RL) problem and introduce RLSyn, a novel framework that models the data generator as a stochastic policy over patient records and optimizes it using Proximal Policy Optimization with discriminator-derived rewards, yielding more stable and data-efficient training. We evaluate RLSyn on two biomedical datasets - AI-READI and MIMIC-IV- and benchmark it against state-of-the-art generative adversarial networks (GANs) and diffusion-based methods across extensive privacy, utility, and fidelity evaluations. RL-Syn performs comparably to diffusion models and outperforms GANs on MIMIC-IV, while outperforming both diffusion models and GANs on the smaller AI-READI dataset. These results demonstrate that reinforcement learning provides a principled and effective alternative for synthetic biomedical data generation, particularly in data-scarce regimes.
- Abstract(参考訳): 合成データ生成(SDG)は、患者のプライバシーを維持しながら、生体医学研究におけるデータ共有を可能にするための有望なアプローチである。
しかし、最先端の生成モデルは、しばしば大規模なデータセットと複雑なトレーニング手順を必要とし、小さなサンプル設定で適用性を制限する。
本研究では、SDGを強化学習(RL)問題として再編成し、患者レコード上の確率的ポリシーとしてデータジェネレータをモデル化する新しいフレームワーク RLSyn を導入し、識別器由来の報酬を用いた近似ポリシー最適化を用いて最適化し、より安定でデータ効率のよいトレーニングを実現する。
我々は、AI-READIとMIMIC-IVの2つのバイオメディカルデータセット上でRTSynを評価し、それを最先端のジェネレーティブ・ディベザリ・ネットワーク(GAN)と、広範囲なプライバシ、ユーティリティ、フィデリティ評価にまたがる拡散に基づく手法と比較した。
RL-Synは拡散モデルとMIMIC-IV上でのGANよりも優れ、AI-READIデータセットでは拡散モデルとGANの両方より優れている。
これらの結果から, 強化学習は, 特にデータスカース体制において, 合成バイオメディカルデータ生成の原則的かつ効果的な代替手段を提供することが示された。
関連論文リスト
- Improving the Generation and Evaluation of Synthetic Data for Downstream Medical Causal Inference [89.5628648718851]
因果推論は医療介入の開発と評価に不可欠である。
現実の医療データセットは、規制障壁のためアクセスが難しいことが多い。
本稿では,医学における治療効果分析のための新しい合成データ生成法STEAMを提案する。
論文 参考訳(メタデータ) (2025-10-21T16:16:00Z) - MedGR$^2$: Breaking the Data Barrier for Medical Reasoning via Generative Reward Learning [4.579424650757833]
既存のデータセット上での監視ファインチューニング(SFT)はしばしば、目に見えないモダリティやタスクの一般化が不十分になる。
我々は,自己改善型活力サイクルを創出する新しいフレームワークである,医療推論のためのジェネレーティブ・リワード・ラーニング(MedGR$2$)を紹介した。
我々の実験は、MedGR$2$生産データを用いたSFTが、大規模で人為的なデータセットで訓練されたベースラインを超えることを実証した。
論文 参考訳(メタデータ) (2025-08-28T08:41:32Z) - Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - TarDiff: Target-Oriented Diffusion Guidance for Synthetic Electronic Health Record Time Series Generation [26.116599951658454]
時系列生成は臨床機械学習モデルの進歩に不可欠である。
観測データのみに対する忠実性は、モデル性能の向上を保証するものではない、と我々は主張する。
タスク固有のインフルエンスガイダンスを統合した,新たなターゲット指向拡散フレームワークであるTarDiffを提案する。
論文 参考訳(メタデータ) (2025-04-24T14:36:10Z) - Prototype-Guided Diffusion for Digital Pathology: Achieving Foundation Model Performance with Minimal Clinical Data [6.318463500874778]
本研究では,高忠実度合成病理データを大規模に生成するプロトタイプ誘導拡散モデルを提案する。
我々のアプローチは、生成したデータの生物学的、診断学的に有意義な変動を保証します。
我々は、大規模な実世界のデータセットでトレーニングされたモデルよりも60倍-760倍少ないデータを使用しても、我々の合成データセットでトレーニングされた自己教師機能によって競争性能が向上することを示した。
論文 参考訳(メタデータ) (2025-04-15T21:17:39Z) - Enhancing EEG Signal Generation through a Hybrid Approach Integrating Reinforcement Learning and Diffusion Models [6.102274021710727]
本研究では、拡散モデルと強化学習を統合することにより、脳波(EEG)信号の合成に革新的なアプローチを導入する。
提案手法は, 時間的・スペクトル的特徴の詳細な脳波信号の生成を促進させ, 合成データセットの信頼性と多様性を向上する。
論文 参考訳(メタデータ) (2024-09-14T07:22:31Z) - Artificial Inductive Bias for Synthetic Tabular Data Generation in Data-Scarce Scenarios [8.062368743143388]
人工的帰納バイアスを生成プロセスに統合し,データ品質を向上させる手法を提案する。
我々は、事前学習、モデル平均化、モデル非依存メタラーニング(MAML)、ドメイン探索(DRS)の4つのアプローチを評価し、生成したテキストの品質への影響を分析する。
実験結果から,帰納的バイアスを取り入れることで,メタラーニングよりも優れた伝達学習法が実現された。
論文 参考訳(メタデータ) (2024-07-03T12:53:42Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited
Data [125.7135706352493]
GAN(Generative Adversarial Network)は、高忠実度画像を合成するために、訓練に十分なデータを必要とする。
近年の研究では、差別者の過度な適合により、限られたデータでGANを訓練することは困難であることが示されている。
本稿では,APA (Adaptive Pseudo Augmentation) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-12T18:13:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。