論文の概要: Enabling Granular Subgroup Level Model Evaluations by Generating Synthetic Medical Time Series
- arxiv url: http://arxiv.org/abs/2510.19728v1
- Date: Wed, 22 Oct 2025 16:17:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:16.132422
- Title: Enabling Granular Subgroup Level Model Evaluations by Generating Synthetic Medical Time Series
- Title(参考訳): 合成医用時系列生成による粒状サブグループモデルの評価
- Authors: Mahmoud Ibrahim, Bart Elen, Chang Sun, Gökhan Ertaylan, Michel Dumontier,
- Abstract要約: テキスト拡張型TimeAutoDiffを導入し,分散アライメントのペナルティにより遅延拡散目標を増大させる。
我々は、MIMIC-IIIとeICUの全てのモデルについて、24時間死亡率と二分長タスクでベンチマークを行った。
32の交叉部分群では、大きな合成コホートがAUROC推定誤差を最大50%削減した。
- 参考スコア(独自算出の注目度): 3.5347586732342435
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a novel framework for leveraging synthetic ICU time-series data not only to train but also to rigorously and trustworthily evaluate predictive models, both at the population level and within fine-grained demographic subgroups. Building on prior diffusion and VAE-based generators (TimeDiff, HealthGen, TimeAutoDiff), we introduce \textit{Enhanced TimeAutoDiff}, which augments the latent diffusion objective with distribution-alignment penalties. We extensively benchmark all models on MIMIC-III and eICU, on 24-hour mortality and binary length-of-stay tasks. Our results show that Enhanced TimeAutoDiff reduces the gap between real-on-synthetic and real-on-real evaluation (``TRTS gap'') by over 70\%, achieving $\Delta_{TRTS} \leq 0.014$ AUROC, while preserving training utility ($\Delta_{TSTR} \approx 0.01$). Crucially, for 32 intersectional subgroups, large synthetic cohorts cut subgroup-level AUROC estimation error by up to 50\% relative to small real test sets, and outperform them in 72--84\% of subgroups. This work provides a practical, privacy-preserving roadmap for trustworthy, granular model evaluation in critical care, enabling robust and reliable performance analysis across diverse patient populations without exposing sensitive EHR data, contributing to the overall trustworthiness of Medical AI.
- Abstract(参考訳): 本稿では,ICUの時系列データを活用するための新しいフレームワークを提案する。
先行拡散とVAEベースのジェネレータ(TimeDiff,HealthGen,TimeAutoDiff)をベースとして,分散配向ペナルティによる潜伏拡散の目的を増大させる「textit{Enhanced TimeAutoDiff}」を導入する。
我々は、MIMIC-IIIとeICUの全てのモデルに対して、24時間死亡率と二分長タスクを広範囲にベンチマークした。
以上の結果から,改良されたTimeAutoDiffは実合成と実合成のギャップを70 %以上削減し,トレーニングユーティリティ(\Delta_{TSTR} \approx 0.01$)を維持しつつ,$\Delta_{TRTS} \leq 0.014$AUROCを実現した。
重要なことに、32個の交叉部分群に対して、大きな合成コホートは、小さな実検体と比較して、サブグループレベルのAUROC推定誤差を最大50 %削減し、72-84 %のサブグループでそれらを上回った。
この作業は、クリティカルケアにおける信頼に値する、きめ細かいモデル評価のための実用的なプライバシ保護ロードマップを提供し、機密性の高いEHRデータを公開せずに、多様な患者集団にわたる堅牢で信頼性の高いパフォーマンス分析を可能にし、医療AIの全体的な信頼性に寄与する。
関連論文リスト
- TarDiff: Target-Oriented Diffusion Guidance for Synthetic Electronic Health Record Time Series Generation [26.116599951658454]
時系列生成は臨床機械学習モデルの進歩に不可欠である。
観測データのみに対する忠実性は、モデル性能の向上を保証するものではない、と我々は主張する。
タスク固有のインフルエンスガイダンスを統合した,新たなターゲット指向拡散フレームワークであるTarDiffを提案する。
論文 参考訳(メタデータ) (2025-04-24T14:36:10Z) - A Scalable k-Medoids Clustering via Whale Optimization Algorithm [0.0]
We introduced WOA-kMedoids, a novel unsupervised clustering method which with the Whale Optimization Algorithm (WOA)。
セントロイド選択を最適化することにより、WOA-kMedoidsは観測数に関して計算複雑性を2次からほぼ直線に減らす。
We showed that WOA-kMedoids achieved a clustering performance with PAM, a average Rand Index (RI) of 0.731 than PAM's 0.739, out Performance PAM on 12 of 25 datasets。
論文 参考訳(メタデータ) (2024-08-30T03:43:37Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Robustness Analysis of Deep Learning Models for Population Synthesis [5.9106199000537645]
複数のデータセットに対するロバスト性を評価するため, 深部生成モデルのブートストラップ信頼区間を示す。
これらのモデルは、2008年、2013年、2018年のモントリオール・オリジン・デスチネーション・サーベイの複数の旅行日記に実装されている。
その結果,CTGANの予測誤差は,複数のデータセットに対する堅牢性を示す信頼区間が狭かった。
論文 参考訳(メタデータ) (2022-11-23T22:55:55Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。