論文の概要: Adaptive Gaussian Process Search for Simulation-Based Sample Size Estimation in Clinical Prediction Models: Validation of the pmsims R Package
- arxiv url: http://arxiv.org/abs/2603.23688v1
- Date: Tue, 24 Mar 2026 19:53:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.016026
- Title: Adaptive Gaussian Process Search for Simulation-Based Sample Size Estimation in Clinical Prediction Models: Validation of the pmsims R Package
- Title(参考訳): 臨床予測モデルにおけるシミュレーションに基づくサンプルサイズ推定のための適応ガウス過程探索:pmsims Rパッケージの検証
- Authors: Oyebayo Ridwan Olaniran, Diana Shamsutdinova, Sarah Markham, Felix Zimmer, Daniel Stahl, Gordon Forbes, Ewan Carr,
- Abstract要約: サンプルサイズ決定のためのフレキシブルなシミュレーションベースのフレームワークを提供するために,ガウス過程シュロゲートモデリングを用いたRパッケージpmsimsを提示し,検証する。
既存の解析手法(pmsampsize)とシミュレーション手法(samplesizedev)とを比較した。
- 参考スコア(独自算出の注目度): 0.45393070061887714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: Determining an adequate sample size is essential for developing reliable and generalisable clinical prediction models, yet practical guidance on selecting appropriate methods remains limited. Existing analytical and simulation-based approaches often rely on restrictive assumptions and focus on mean-based criteria. We present and validate pmsims, an R package that uses Gaussian process surrogate modelling to provide a flexible and computationally efficient simulation-based framework for sample size determination across diverse prediction settings. Methods: We conducted a comprehensive simulation study with two aims. First, we compared three search engines implemented in pmsims: a Gaussian process-based adaptive method, a deterministic bisection method, and a hybrid approach, across binary, continuous, and survival outcomes. Second, we benchmarked the best-performing pmsims engine against existing analytical (pmsampsize) and simulation-based (samplesizedev) methods, evaluating recommended sample sizes, computational time, and achieved performance on large independent validation datasets. Results: The Gaussian process-based method consistently produced the most stable sample size estimates, particularly in low-signal, high-dimensional settings. In benchmarking, pmsims achieved performance close to prespecified targets across all outcome types, matching simulation-based approaches and outperforming analytical methods in more challenging scenarios. Conclusions: pmsims provides an efficient and flexible framework for principled sample size planning in clinical prediction modelling, requiring fewer model evaluations than non-adaptive simulation approaches.
- Abstract(参考訳): 背景: 信頼性と一般的な臨床予測モデルを開発するためには, 適切なサンプルサイズを決定することが不可欠であるが, 適切な方法を選択するための実践的ガイダンスは限られている。
既存の分析的およびシミュレーションに基づくアプローチは、しばしば制限的な仮定に頼り、平均的基準にフォーカスする。
我々は,ガウス過程シュロゲートモデルを用いたRパッケージであるpmsimsを,多様な予測設定にまたがるサンプルサイズ決定のためのフレキシブルで効率的なシミュレーションベースフレームワークとして提示し,検証する。
方法: 2つの目的を持つ総合シミュレーション研究を行った。
まず、pmsimsで実装された3つの検索エンジンを比較し、ガウスのプロセスベース適応法、決定論的二項分割法、二進法、連続法、生存法のハイブリッドアプローチを比較した。
第2に、既存の分析手法(pmsampsize)とシミュレーションに基づく手法(samplesizedev)とを比較し、推奨サンプルサイズ、計算時間、大規模独立検証データセットの性能を評価する。
結果:ガウス過程に基づく手法は,特に低信号,高次元の設定において,最も安定なサンプルサイズ推定を一貫して生成する。
ベンチマークでは、pmsimsはすべての結果タイプにまたがる所定の目標に近いパフォーマンスを達成し、シミュレーションベースのアプローチにマッチし、より困難なシナリオで分析手法より優れたパフォーマンスを実現した。
結論: pmsimsは、臨床予測モデリングにおける原則化されたサンプルサイズ計画のための効率的で柔軟なフレームワークを提供する。
関連論文リスト
- Sample Size Calculations for Developing Clinical Prediction Models: Overview and pmsims R package [0.45393070061887714]
不適切なサンプルサイズは、過度な適合、一般化可能性の低下、偏りのある予測につながる可能性がある。
ルール、クローズドフォーム公式、シミュレーションベースの方法といった既存のアプローチは、柔軟性と精度が異なる。
平均基準と保証基準を区別する概念的枠組みを導入する。
本稿では,学習曲線,ガウス過程最適化,保証原理を統合したシミュレーションに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2026-02-26T21:24:34Z) - Machine learning to optimize precision in the analysis of randomized trials: A journey in pre-specified, yet data-adaptive learning [2.6827221447298406]
我々は、共変量調整のための機械学習ベースのアプローチを開発し、評価し、実装するという私たちの物語を語る。
我々は, 限界効果を推定するためのアプローチについて, 実用上の問題だけでなく, 理論的根拠を提供する。
本研究は,最近公表された8治験の予備的,特定された分析に本手法を適用した結果について述べる。
論文 参考訳(メタデータ) (2025-12-15T18:05:45Z) - Simulation-based Methods for Optimal Sampling Design in Systems Biology [0.38233569758620045]
本研究では,最適サンプリング設計のための2つのシミュレーション手法を提案する。
E-Optimal- rank (EOR) はE-Optimal criterionを使用し、E-Optimal criterionはLong Short-Term Memory (LSTM) ニューラルネットワークを使用する。
Lotka-Volterra と 3-compartment モデルに基づくシミュレーション研究は、提案手法がランダム選択と古典的E-最適設計の両方より優れていることを示した。
論文 参考訳(メタデータ) (2025-11-10T15:26:51Z) - Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.52119063742121]
独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。
本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。
我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文 参考訳(メタデータ) (2025-05-21T07:16:44Z) - An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Maximum Likelihood Learning of Unnormalized Models for Simulation-Based
Inference [44.281860162298564]
シミュレーションベース推論のための2つの合成確率法を提案する。
本研究では,シミュレータによって生成された合成データを用いて,条件付きエネルギーベースモデル(EBM)を学習する。
本研究は, カニの神経科学ネットワークのモデルに適用し, 各種合成データセット上での両手法の特性を実証する。
論文 参考訳(メタデータ) (2022-10-26T14:38:24Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - fETSmcs: Feature-based ETS model component selection [8.99236558175168]
シミュレーションデータに基づく分類器の訓練によるETSモデル選択の効率的な手法を提案し, 与えられた時系列に対する適切なモデル成分の予測を行う。
提案手法は,広く使用されている予測競合データセットM4に対して,点予測と予測間隔の両面から評価する。
論文 参考訳(メタデータ) (2022-06-26T13:52:43Z) - Calibrating Over-Parametrized Simulation Models: A Framework via
Eligibility Set [3.862247454265944]
厳密な頻繁な統計的保証を満たす校正手法を開発するための枠組みを開発する。
本手法は,書籍市場シミュレータのキャリブレーションへの応用を含む,いくつかの数値例で実証する。
論文 参考訳(メタデータ) (2021-05-27T00:59:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。