論文の概要: Sample Size Calculations for Developing Clinical Prediction Models: Overview and pmsims R package
- arxiv url: http://arxiv.org/abs/2602.23507v1
- Date: Thu, 26 Feb 2026 21:24:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.135497
- Title: Sample Size Calculations for Developing Clinical Prediction Models: Overview and pmsims R package
- Title(参考訳): 臨床予測モデル開発のためのサンプルサイズ計算:概要とpmsims Rパッケージ
- Authors: Diana Shamsutdinova, Felix Zimmer, Oyebayo Ridwan Olaniran, Sarah Markham, Daniel Stahl, Gordon Forbes, Ewan Carr,
- Abstract要約: 不適切なサンプルサイズは、過度な適合、一般化可能性の低下、偏りのある予測につながる可能性がある。
ルール、クローズドフォーム公式、シミュレーションベースの方法といった既存のアプローチは、柔軟性と精度が異なる。
平均基準と保証基準を区別する概念的枠組みを導入する。
本稿では,学習曲線,ガウス過程最適化,保証原理を統合したシミュレーションに基づく新しい手法を提案する。
- 参考スコア(独自算出の注目度): 0.45393070061887714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: Clinical prediction models are increasingly used to inform healthcare decisions, but determining the minimum sample size for their development remains a critical and unresolved challenge. Inadequate sample sizes can lead to overfitting, poor generalisability, and biased predictions. Existing approaches, such as heuristic rules, closed-form formulas, and simulation-based methods, vary in flexibility and accuracy, particularly for complex data structures and machine learning models. Methods: We review current methodologies for sample size estimation in prediction modelling and introduce a conceptual framework that distinguishes between mean-based and assurance-based criteria. Building on this, we propose a novel simulation-based approach that integrates learning curves, Gaussian Process optimisation, and assurance principles to identify sample sizes that achieve target performance with high probability. This approach is implemented in pmsims, an open-source, model-agnostic R package. Results: Through case studies, we demonstrate that sample size estimates vary substantially across methods, performance metrics, and modelling strategies. Compared to existing tools, pmsims provides flexible, efficient, and interpretable solutions that accommodate diverse models and user-defined metrics while explicitly accounting for variability in model performance. Conclusions: Our framework and software advance sample size methodology for clinical prediction modelling by combining flexibility with computational efficiency. Future work should extend these methods to hierarchical and multimodal data, incorporate fairness and stability metrics, and address challenges such as missing data and complex dependency structures.
- Abstract(参考訳): 背景: 臨床予測モデルは、医療上の決定を伝えるためにますます使われていますが、その開発に必要な最小サンプルサイズを決定することは、批判的で未解決の課題です。
不適切なサンプルサイズは、過度な適合、一般化可能性の低下、偏りのある予測につながる可能性がある。
ヒューリスティックルール、クローズドフォーム公式、シミュレーションベースの方法といった既存のアプローチは、特に複雑なデータ構造や機械学習モデルにおいて、柔軟性と正確性が異なる。
方法: 予測モデリングにおけるサンプルサイズ推定手法を概観し, 平均基準と保証基準を区別する概念的枠組みを導入する。
そこで本研究では,学習曲線,ガウス過程最適化,保証原理を統合したシミュレーションに基づく新しい手法を提案する。
このアプローチは、オープンソースのモデルに依存しないRパッケージであるpmsimsで実装されている。
結果: ケーススタディを通じて, サンプルサイズの推定値が, メソッド, パフォーマンス指標, モデリング戦略によって大きく異なることを示す。
既存のツールと比較して、pmsimsは、さまざまなモデルとユーザ定義メトリクスに対応し、モデルパフォーマンスの多様性を明確に説明しながら、柔軟性、効率的、解釈可能なソリューションを提供する。
結論: このフレームワークとソフトウェアは, フレキシビリティと計算効率を組み合わせることで, 臨床予測モデリングのためのサンプルサイズ手法を開発した。
今後の作業では、これらの手法を階層的およびマルチモーダルなデータに拡張し、公正性と安定性のメトリクスを取り入れ、データ不足や複雑な依存関係構造といった課題に対処する必要がある。
関連論文リスト
- Quantifying and Attributing Submodel Uncertainty in Stochastic Simulation Models and Digital Twins [0.1234398109349733]
本稿では,サブモデルの不確実性がシステム性能指標の推定に与える影響について検討する。
本研究では,シミュレーションモデルにおけるサブモデル不確実性を定量化するためのフレームワークを開発し,そのフレームワークをデジタルツイン設定に拡張する。
論文 参考訳(メタデータ) (2026-02-18T00:06:39Z) - Model Correlation Detection via Random Selection Probing [62.093777777813756]
既存の類似性に基づく手法では、モデルパラメータにアクセスしたり、しきい値なしでスコアを生成する必要がある。
本稿では,モデル相関検出を統計的テストとして定式化する仮説テストフレームワークであるランダム選択探索(RSP)を紹介する。
RSPは相関の証拠を定量化する厳密なp-値を生成する。
論文 参考訳(メタデータ) (2025-09-29T01:40:26Z) - Covariate-dependent Graphical Model Estimation via Neural Networks with Statistical Guarantees [18.106204331704156]
グラフ構造が共依存する設定を検討し、それを推定するためのディープニューラルネットワークベースのアプローチを検討する。
経験的リスク最小化フレームワークで一般的に用いられる仮定の下で,PAC保証による理論的結果が確立される。
提案手法の性能をいくつかの合成データ設定で評価し,既存手法と比較した。
論文 参考訳(メタデータ) (2025-04-23T02:13:36Z) - Comprehensive Benchmarking of Machine Learning Methods for Risk Prediction Modelling from Large-Scale Survival Data: A UK Biobank Study [0.0]
大規模コホート研究と機械学習(ML)アルゴリズムの多種多様なツールキットにより、このような生存課題の取り組みが促進されている。
我々は,線形学習モデルからディープラーニング(DL)モデルまで,8つのサバイバルタスク実装のベンチマークを試みた。
n = 5,000からn = 250,000のサンプルサイズで、異なるアーキテクチャがいかにうまくスケールするかを評価した。
論文 参考訳(メタデータ) (2025-03-11T20:27:20Z) - Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - Variable Importance Matching for Causal Inference [73.25504313552516]
これらの目標を達成するためのModel-to-Matchと呼ばれる一般的なフレームワークについて説明する。
Model-to-Matchは、距離メートル法を構築するために変数重要度測定を使用する。
LASSO を用いて Model-to-Match フレームワークを運用する。
論文 参考訳(メタデータ) (2023-02-23T00:43:03Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Calibrating Over-Parametrized Simulation Models: A Framework via
Eligibility Set [3.862247454265944]
厳密な頻繁な統計的保証を満たす校正手法を開発するための枠組みを開発する。
本手法は,書籍市場シミュレータのキャリブレーションへの応用を含む,いくつかの数値例で実証する。
論文 参考訳(メタデータ) (2021-05-27T00:59:29Z) - How Faithful is your Synthetic Data? Sample-level Metrics for Evaluating
and Auditing Generative Models [95.8037674226622]
ドメインに依存しない方法で生成モデルの忠実度,多様性,一般化性能を特徴付ける3次元評価指標を提案する。
当社のメトリクスは、精度リコール分析により統計的発散測定を統合し、モデル忠実度と多様性のサンプルおよび分布レベルの診断を可能にします。
論文 参考訳(メタデータ) (2021-02-17T18:25:30Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z) - Amortized Bayesian model comparison with evidential deep learning [0.12314765641075436]
本稿では,専門的なディープラーニングアーキテクチャを用いたベイズモデルの比較手法を提案する。
提案手法は純粋にシミュレーションベースであり,観測された各データセットに対して,すべての代替モデルを明示的に適合させるステップを回避している。
提案手法は,本研究で検討した事例に対して,精度,キャリブレーション,効率の点で優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2020-04-22T15:15:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。