論文の概要: Rethinking external validation for the target population: Capturing patient-level similarity with a generative model
- arxiv url: http://arxiv.org/abs/2605.11284v1
- Date: Mon, 11 May 2026 22:11:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.450986
- Title: Rethinking external validation for the target population: Capturing patient-level similarity with a generative model
- Title(参考訳): 対象集団に対する外的検証の再考:生成モデルによる患者レベルの類似性の把握
- Authors: Mohammad Azizmalayeri, Ameen Abu-Hanna, Saskia Houterman, Marije M. Vis, Giovanni Cinà,
- Abstract要約: 本稿では,各外部患者の開発データとの類似性を定量化する枠組みを提案する。
類似性を推定するために、生成モデル、特にオートエンコーダを使用します。
結果:本フレームワークは類似性定義サブグループ間でのモデル性能のかなりの変動を明らかにした。
- 参考スコア(独自算出の注目度): 1.5535982620458004
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: External validation is essential for assessing the transportability of predictive models. However, its interpretation is often confounded by differences between external and development populations. This study introduces a framework to distinguish model deficiencies from case-mix effects. Method: We propose a framework that quantifies each external patient's similarity to the development data and measures performance in subgroups with varying levels of alignment to the development distribution. We use generative models, specifically autoencoders, to estimate similarity, offering a more flexible alternative to traditional linear approaches and enabling validation without sharing the original development data. The utility of autoencoder-based similarity measure is demonstrated using synthetic data, and the framework's application is illustrated using data from the Netherlands Heart Registration (NHR) to predict mortality after transcatheter aortic valve implantation. Results: Our framework revealed substantial variation in model performance across similarity-defined subgroups, differences that remain hidden under conventional external validation yet can meaningfully alter conclusions. In several settings, conventional external validation suggested poor overall performance. However, after accounting for differences in patient characteristics, for some sub-groups, the model performance was consistent with internal validation results. Conversely, apparently acceptable overall performance could mask clinically relevant performance deficits in specific subgroups. Conclusion: The proposed framework enhances the interpretability of external validation by linking model performance to population alignment with the development data. This provides a more principled basis for deciding whether a model is transportable and to which patients it can be safely applied.
- Abstract(参考訳): 背景: 予測モデルの輸送可能性を評価するためには,外部検証が不可欠である。
しかし、その解釈は、しばしば外集団と開発集団の違いによって成り立っている。
本研究では,モデル欠陥とケースミックス効果を区別する枠組みを提案する。
方法: それぞれの外部患者の開発データとの類似性を定量化し, 開発分布の調整レベルが異なるサブグループにおけるパフォーマンスを測定する枠組みを提案する。
生成モデル、特にオートエンコーダを使用して類似性を推定し、従来の線形アプローチよりも柔軟な代替手段を提供し、元の開発データを共有せずに検証を可能にします。
オートエンコーダを用いた類似度測定の有用性を合成データを用いて実証し、オランダ心臓登録(NHR)のデータを用いて、大動脈弁移植後の死亡率を予測する。
結果: 本フレームワークでは, 類似性定義サブグループ間でのモデル性能の変動が顕著であり, 従来の外部検証では隠蔽されるが, 結論を有意に変更することができる。
いくつかの設定では、従来の外部検証は全体的な性能が低かった。
しかし,患者特性の違いを考慮に入れた結果,一部のサブグループでは,モデルの性能は内部検証結果と一致していた。
逆に、明らかに受け入れられる全体的なパフォーマンスは、特定のサブグループの臨床的に関連するパフォーマンス障害を隠蔽する可能性がある。
結論: 提案フレームワークは, モデル性能と個体群アライメントを開発データにリンクすることにより, 外部検証の解釈可能性を高める。
これは、モデルが輸送可能かどうか、どの患者を安全に適用できるかを決定するためのより原則化された基盤を提供する。
関連論文リスト
- Nonparametric Data Attribution for Diffusion Models [57.820618036556084]
生成モデルのデータ属性は、個々のトレーニング例がモデル出力に与える影響を定量化する。
生成画像とトレーニング画像のパッチレベルの類似性によって影響を測定する非パラメトリック属性法を提案する。
論文 参考訳(メタデータ) (2025-10-16T03:37:16Z) - SeFEF: A Seizure Forecasting Evaluation Framework [0.0]
我々は,発作予測アルゴリズムの開発,評価,ドキュメントの効率化を目的としたPythonベースのフレームワークを紹介する。
このフレームワークは、データラベリング、クロスバリデーション分割、予測後処理、パフォーマンス評価、レポートを自動化する。
様々な予測水平線をサポートし、実装の詳細、トレーニングと評価設定、パフォーマンスメトリクスを文書化するモデルカードを含んでいる。
論文 参考訳(メタデータ) (2025-10-13T11:10:27Z) - Bridging the Generalisation Gap: Synthetic Data Generation for Multi-Site Clinical Model Validation [0.3362278589492841]
既存のモデル評価アプローチは、可用性に制限のある実世界のデータセットに頼っていることが多い。
本稿では, ベンチマークモデル, 公正性, 一般化性の制御されたロバスト性を考慮した, 構造化された合成データフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-29T11:04:28Z) - Flexible Nonparametric Inference for Causal Effects under the Front-Door Model [2.6900047294457683]
本研究では, 平均治療効果, 平均治療効果の両面から, 新規な1段階, 目標最小損失ベース推定装置を開発した。
我々の推定器は観測されたデータ分布のパラメータ化に基づいて構築され、メディエータ密度を完全に回避するアプローチを含む。
因果効果推定器の効率を向上させるためにこれらの制約をどのように活用できるかを示す。
論文 参考訳(メタデータ) (2023-12-15T22:04:53Z) - A Causal Inference Framework for Leveraging External Controls in Hybrid
Trials [1.7942265700058988]
ランダム化トライアルのデータを外部ソースの制御データで拡張した環境での因果推論に関わる課題を考察する。
提案手法は, 推定器, 評価効率境界, および効率的な2次ロバスト推定のためのアプローチである。
筋萎縮性筋萎縮症の運動機能に対するrisdisplamの効果について検討した。
論文 参考訳(メタデータ) (2023-05-15T19:15:32Z) - Bayesian Networks for the robust and unbiased prediction of depression
and its symptoms utilizing speech and multimodal data [65.28160163774274]
我々は,抑うつ,抑うつ症状,および,胸腺で収集された音声,表情,認知ゲームデータから得られる特徴の関連性を把握するためにベイズ的枠組みを適用した。
論文 参考訳(メタデータ) (2022-11-09T14:48:13Z) - Causal Inference via Nonlinear Variable Decorrelation for Healthcare
Applications [60.26261850082012]
線形および非線形共振の両方を扱う可変デコリレーション正規化器を用いた新しい手法を提案する。
我々は、モデル解釈可能性を高めるために、元の特徴に基づくアソシエーションルールマイニングを用いた新しい表現として、アソシエーションルールを採用する。
論文 参考訳(メタデータ) (2022-09-29T17:44:14Z) - Selecting Treatment Effects Models for Domain Adaptation Using Causal
Knowledge [82.5462771088607]
監視されていないドメイン適応設定下でITE法用に特別に設計された新しいモデル選択メトリックを提案する。
特に,介入効果の予測が対象領域の既知の因果構造を満たすモデルを選択することを提案する。
論文 参考訳(メタデータ) (2021-02-11T21:03:14Z) - Estimating the Effects of Continuous-valued Interventions using
Generative Adversarial Networks [103.14809802212535]
我々は,連続的評価介入の効果を推定する問題に対処するため,GAN(Generative Adversarial Network)フレームワークを構築した。
我々のモデルであるSCIGANは柔軟であり、いくつかの異なる継続的な介入に対する対実的な結果の同時推定が可能である。
継続的な介入に移行することによって生じる課題に対処するために、差別者のための新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T18:46:21Z) - NestedVAE: Isolating Common Factors via Weak Supervision [45.366986365879505]
我々は、バイアス低減の課題と、ドメイン間で共通する分離要因の関係を同定する。
共通因子を分離するために、潜伏変数モデルの理論と情報ボトルネック理論を組み合わせる。
共有重みを持つ2つの外部VAEは入力を再構成し、潜伏空間を推論し、一方、ネストされたVAEはペア化された画像の潜伏表現から1つの画像の潜伏表現を再構成しようとする。
論文 参考訳(メタデータ) (2020-02-26T15:49:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。