論文の概要: SurvDiff: A Diffusion Model for Generating Synthetic Data in Survival Analysis
- arxiv url: http://arxiv.org/abs/2509.22352v1
- Date: Fri, 26 Sep 2025 13:50:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.465795
- Title: SurvDiff: A Diffusion Model for Generating Synthetic Data in Survival Analysis
- Title(参考訳): SurvDiff:生存分析における合成データ生成の拡散モデル
- Authors: Marie Brockschmidt, Maresa Schröder, Stefan Feuerriegel,
- Abstract要約: 生存分析は、転移、疾患再発、または患者の死亡などの時間と時間の結果をモデル化することによって臨床研究の基盤となる。
SurvDiffは、生存分析において合成データを生成するために特別に設計されたエンドツーエンドの拡散モデルである。
シュルブディフは、複数の医療データセットにおける分布的忠実度と下流評価指標の両方において、最先端の世代ベースラインを一貫して上回ることを示す。
- 参考スコア(独自算出の注目度): 34.89334607334426
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Survival analysis is a cornerstone of clinical research by modeling time-to-event outcomes such as metastasis, disease relapse, or patient death. Unlike standard tabular data, survival data often come with incomplete event information due to dropout, or loss to follow-up. This poses unique challenges for synthetic data generation, where it is crucial for clinical research to faithfully reproduce both the event-time distribution and the censoring mechanism. In this paper, we propose SurvDiff, an end-to-end diffusion model specifically designed for generating synthetic data in survival analysis. SurvDiff is tailored to capture the data-generating mechanism by jointly generating mixed-type covariates, event times, and right-censoring, guided by a survival-tailored loss function. The loss encodes the time-to-event structure and directly optimizes for downstream survival tasks, which ensures that SurvDiff (i) reproduces realistic event-time distributions and (ii) preserves the censoring mechanism. Across multiple datasets, we show that \survdiff consistently outperforms state-of-the-art generative baselines in both distributional fidelity and downstream evaluation metrics across multiple medical datasets. To the best of our knowledge, SurvDiff is the first diffusion model explicitly designed for generating synthetic survival data.
- Abstract(参考訳): 生存分析は、転移、疾患再発、または患者の死亡などの時間と時間の結果をモデル化することによって臨床研究の基盤となる。
通常の表データとは異なり、サバイバルデータには、ドロップアウトやフォローアップの損失による不完全なイベント情報があることが多い。
これは、臨床研究において、事象時分布と検閲機構の両方を忠実に再現することが不可欠である合成データ生成に固有の課題である。
本稿では,生存分析における合成データの生成に特化して設計されたエンドツーエンド拡散モデルであるSurvDiffを提案する。
SurvDiffは、生存調整損失関数によって誘導される混合型共変量、イベント時間、右検閲を共同生成することにより、データ生成メカニズムを捉えるように調整されている。
この損失は時間とイベントの構造を符号化し、下流でのサバイバルタスクを直接最適化することで、SurvDiffを確実にする。
(i)現実的な事象時分布を再現し、
(二)検閲機構を整備する。
複数のデータセットにまたがって、Shasurvdiffは、複数の医療データセットにおける分布の忠実度と下流評価の両方において、最先端の生成ベースラインを一貫して上回ることを示す。
我々の知る限りでは、SurvDiffは人工生存データを生成するために明示的に設計された最初の拡散モデルである。
関連論文リスト
- SeqRisk: Transformer-augmented latent variable model for improved survival prediction with longitudinal data [4.1476925904032464]
本研究では,変分オートエンコーダ (VAE) と長手VAE (LVAE) をトランスフォーマーエンコーダとコックス比例ハザードモジュールに結合してリスク予測を行う手法であるSeqRiskを提案する。
SeqRiskは、シミュレーションと実世界の両方のデータセットにおける既存のアプローチと比較して、競合的に機能することを示した。
論文 参考訳(メタデータ) (2024-09-19T12:35:25Z) - Multi-modal Data Binding for Survival Analysis Modeling with Incomplete Data and Annotations [19.560652381770243]
我々は、モダリティと検閲されたサバイバルラベルにまたがる不完全なデータを同時に扱う新しいフレームワークを導入する。
我々のアプローチでは、高度な基礎モデルを用いて個々のモダリティを符号化し、それらを普遍的な表現空間に整列させる。
提案手法は,2つのサバイバル分析タスクにおいて,両者が適用したデータセットの予測精度に優れることを示す。
論文 参考訳(メタデータ) (2024-07-25T02:55:39Z) - Generating Accurate Synthetic Survival Data by Conditioning on Outcomes [16.401141867387324]
合成されたデータは、プライバシ、公正性、データアクセシビリティを改善することができる。
この設定における重要な課題の1つは検閲、すなわちイベントのタイミングが不明な場合である。
既存の手法では、合成データを生成する際に観測時間と検閲時間の両方の分布を正確に再現することが困難である。
論文 参考訳(メタデータ) (2024-05-27T16:34:18Z) - TripleSurv: Triplet Time-adaptive Coordinate Loss for Survival Analysis [15.496918127515665]
本稿では,学習過程の複雑さを扱える時間適応座標損失関数TripleSurvを提案する。
我々のTripleSurvは3つの実世界の生存データセットと公開合成データセットで評価されている。
論文 参考訳(メタデータ) (2024-01-05T08:37:57Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - SurvivalGAN: Generating Time-to-Event Data for Survival Analysis [121.84429525403694]
検閲と時間的地平線の不均衡は、生成モデルに生存分析に特有の3つの新しい障害モードを経験させる。
本稿では,検閲やイベントの地平線における不均衡に対処し,生存データを扱う生成モデルであるSurvivalGANを提案する。
医療データセットに関する広範な実験により,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-02-24T17:03:51Z) - SurvLatent ODE : A Neural ODE based time-to-event model with competing
risks for longitudinal data improves cancer-associated Deep Vein Thrombosis
(DVT) prediction [68.8204255655161]
本稿では,不規則なサンプルデータの下で潜在表現をパラメータ化する生成時間対イベントモデルSurvLatent ODEを提案する。
そこで,本モデルでは,事象特異的ハザード関数の形状を指定せずに,複数の競合イベントの生存時間を柔軟に推定する。
SurvLatent ODEは、DVTリスクグループを成層化するために、現在の臨床標準であるKhorana Riskスコアより優れている。
論文 参考訳(メタデータ) (2022-04-20T17:28:08Z) - DeepRite: Deep Recurrent Inverse TreatmEnt Weighting for Adjusting
Time-varying Confounding in Modern Longitudinal Observational Data [68.29870617697532]
時系列データにおける時間変化の相違に対するDeep Recurrent Inverse TreatmEnt重み付け(DeepRite)を提案する。
DeepRiteは、合成データから基底的真理を復元し、実際のデータから偏りのない処理効果を推定する。
論文 参考訳(メタデータ) (2020-10-28T15:05:08Z) - A General Framework for Survival Analysis and Multi-State Modelling [70.31153478610229]
ニューラル常微分方程式を多状態生存モデル推定のためのフレキシブルで一般的な方法として用いる。
また,本モデルでは,サバイバルデータセット上での最先端性能を示すとともに,マルチステート環境での有効性を示す。
論文 参考訳(メタデータ) (2020-06-08T19:24:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。