論文の概要: Evaluation metrics for temporal preservation in synthetic longitudinal patient data
- arxiv url: http://arxiv.org/abs/2602.10643v1
- Date: Wed, 11 Feb 2026 08:44:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.60314
- Title: Evaluation metrics for temporal preservation in synthetic longitudinal patient data
- Title(参考訳): 慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性
- Authors: Katariina Perkonoja, Parisa Movahedi, Antti Airola, Kari Auranen, Joni Virta,
- Abstract要約: 本研究は, 慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期における慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性期慢性
提案手法は, 合成データの時間的特性を, 限界, 共分散, 個人レベル, 測定構造に分類し, どのように再現するかを評価する。
提案手法は, 時間構造をいかに保存するか, 劣化するかを明らかにし, より信頼性の高い生成モデルの評価と改善を可能にする。
- 参考スコア(独自算出の注目度): 0.35884531400117975
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This study introduces a set of metrics for evaluating temporal preservation in synthetic longitudinal patient data, defined as artificially generated data that mimic real patients' repeated measurements over time. The proposed metrics assess how synthetic data reproduces key temporal characteristics, categorized into marginal, covariance, individual-level and measurement structures. We show that strong marginal-level resemblance may conceal distortions in covariance and disruptions in individual-level trajectories. Temporal preservation is influenced by factors such as original data quality, measurement frequency, and preprocessing strategies, including binning, variable encoding and precision. Variables with sparse or highly irregular measurement times provide limited information for learning temporal dependencies, resulting in reduced resemblance between the synthetic and original data. No single metric adequately captures temporal preservation; instead, a multidimensional evaluation across all characteristics provides a more comprehensive assessment of synthetic data quality. Overall, the proposed metrics clarify how and why temporal structures are preserved or degraded, enabling more reliable evaluation and improvement of generative models and supporting the creation of temporally realistic synthetic longitudinal patient data.
- Abstract(参考訳): 本研究は, 人工的に生成したデータとして定義され, 経時的に繰り返し測定される患者の時間的保存を評価するための指標について紹介する。
提案手法は, 合成データの時間的特性を, 限界, 共分散, 個人レベル, 測定構造に分類し, どのように再現するかを評価する。
その結果,強い辺縁レベルの類似性は,個々の軌跡の共分散や乱れの歪みを隠蔽する可能性が示唆された。
時間保存は、オリジナルのデータ品質、測定周波数、ビンニング、可変符号化、精度などの前処理戦略などの影響を受けている。
スパースまたは非常に不規則な測定時間を持つ変数は、時間的依存を学習するための限られた情報を提供し、結果として合成データと原データとの類似性が低下する。
時間的保存を適切に捉える指標は存在しないが、全ての特性を多次元的に評価することで、合成データの品質をより包括的に評価することができる。
提案した指標は, 時間構造をいかに保存するか, 劣化するかを明らかにするとともに, 生成モデルの信頼性を高め, 時間的に現実的な合成長大な患者データの作成を支援する。
関連論文リスト
- Generating High-quality Privacy-preserving Synthetic Data [0.0]
本稿では,このトレードオフを改善するために,任意の合成データ生成装置上に適用可能なモデル非依存のポストプロセッシングフレームワークについて検討する。
我々はこのフレームワークを、表データのための2つのニューラル生成モデル、フィードフォワードジェネレータ、変分オートエンコーダのためにインスタンス化する。
クレジットカード取引、心臓血管の健康、国勢調査に基づく収入の3つの公開データセットで評価した。
論文 参考訳(メタデータ) (2026-02-06T05:03:49Z) - Independent Component Discovery in Temporal Count Data [46.526610368455096]
本稿では、時間数データの独立成分分析のための生成フレームワークを導入し、レギュラー適応力学とポアソン対数正規放出を組み合わせた。
このモデルは、状態に依存したコントリビューションで絡み合ったコンポーネントを特定し、表現学習と摂動解析を可能にする。
論文 参考訳(メタデータ) (2026-01-29T13:30:10Z) - Improving the Generation and Evaluation of Synthetic Data for Downstream Medical Causal Inference [89.5628648718851]
因果推論は医療介入の開発と評価に不可欠である。
現実の医療データセットは、規制障壁のためアクセスが難しいことが多い。
本稿では,医学における治療効果分析のための新しい合成データ生成法STEAMを提案する。
論文 参考訳(メタデータ) (2025-10-21T16:16:00Z) - Compositionality in Time Series: A Proof of Concept using Symbolic Dynamics and Compositional Data Augmentation [7.237068561453081]
本研究は、自然現象の時系列が、体系的および規則的な方法で順序付けられた潜在状態の列によって生成されると理解できるかどうかを考察する。
本研究は,臨床時系列に焦点をあて,臨床測定が系統的原則に従っている有意義な生理的状態によって生成されると解釈できるかどうかを問う。
論文 参考訳(メタデータ) (2025-08-28T11:02:21Z) - T-Phenotype: Discovering Phenotypes of Predictive Temporal Patterns in
Disease Progression [82.85825388788567]
我々は、ラベル付き時系列データから予測時相パターンの表現型を発見するために、新しい時間的クラスタリング手法T-Phenotypeを開発した。
T-フェノタイプは, 評価ベースラインのすべてに対して, 最良の表現型発見性能を示す。
論文 参考訳(メタデータ) (2023-02-24T13:30:35Z) - Temporal Robustness against Data Poisoning [69.01705108817785]
データ中毒は、悪意のあるトレーニングデータを通じて、敵対者が機械学習アルゴリズムの振る舞いを操作する場合を考慮している。
本研究では,攻撃開始時間と攻撃持続時間を測定する2つの新しい指標である耳線と持続時間を用いたデータ中毒の時間的脅威モデルを提案する。
論文 参考訳(メタデータ) (2023-02-07T18:59:19Z) - Evaluation of the Synthetic Electronic Health Records [3.255030588361125]
本研究は、合成データセットのサンプルワイズ評価のための類似性と特異性という2つの指標を概説する。
本研究は,Cystic Fibrosis (CF) 患者の電子的健康記録を合成するために,いくつかの最先端の遺伝子モデルを用いて提案された概念を実証する。
論文 参考訳(メタデータ) (2022-10-16T22:46:08Z) - Holdout-Based Fidelity and Privacy Assessment of Mixed-Type Synthetic
Data [0.0]
aiベースのデータ合成はここ数年で急速に進歩しており、プライバシを尊重するデータ共有を可能にするという約束がますます認識されている。
我々は,合成データソリューションの信頼性とプライバシリスクを定量化するための,ホールドアウトに基づく実証的評価フレームワークを紹介し,実証する。
論文 参考訳(メタデータ) (2021-04-01T17:30:23Z) - DeepRite: Deep Recurrent Inverse TreatmEnt Weighting for Adjusting
Time-varying Confounding in Modern Longitudinal Observational Data [68.29870617697532]
時系列データにおける時間変化の相違に対するDeep Recurrent Inverse TreatmEnt重み付け(DeepRite)を提案する。
DeepRiteは、合成データから基底的真理を復元し、実際のデータから偏りのない処理効果を推定する。
論文 参考訳(メタデータ) (2020-10-28T15:05:08Z) - Hide-and-Seek Privacy Challenge [88.49671206936259]
NeurIPS 2020 Hide-and-Seek Privacy Challengeは、両方の問題を解決するための新しい2トラックの競争だ。
我々の頭から頭までのフォーマットでは、新しい高品質な集中ケア時系列データセットを用いて、合成データ生成トラック(「ヒッシャー」)と患者再識別トラック(「シーカー」)の参加者が直接対決する。
論文 参考訳(メタデータ) (2020-07-23T15:50:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。