論文の概要: Efficient Randomized Experiments Using Foundation Models
- arxiv url: http://arxiv.org/abs/2502.04262v1
- Date: Thu, 06 Feb 2025 17:54:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:33:27.455173
- Title: Efficient Randomized Experiments Using Foundation Models
- Title(参考訳): 基礎モデルを用いた効率的なランダム化実験
- Authors: Piersilvio De Bartolomeis, Javier Abad, Guanbo Wang, Konstantin Donhauser, Raymond M. Duch, Fanny Yang, Issa J. Dahabreh,
- Abstract要約: 本稿では,複数の基礎モデルからの予測を,統計的に妥当な推測を保ちながら統合する手法を提案する。
我々の推定器は、実験データのみに基づく標準推定器と同じ精度のサンプルサイズを最大20%削減する、かなり精度の高いゲインを提供する。
- 参考スコア(独自算出の注目度): 10.606998433337894
- License:
- Abstract: Randomized experiments are the preferred approach for evaluating the effects of interventions, but they are costly and often yield estimates with substantial uncertainty. On the other hand, in silico experiments leveraging foundation models offer a cost-effective alternative that can potentially attain higher statistical precision. However, the benefits of in silico experiments come with a significant risk: statistical inferences are not valid if the models fail to accurately predict experimental responses to interventions. In this paper, we propose a novel approach that integrates the predictions from multiple foundation models with experimental data while preserving valid statistical inference. Our estimator is consistent and asymptotically normal, with asymptotic variance no larger than the standard estimator based on experimental data alone. Importantly, these statistical properties hold even when model predictions are arbitrarily biased. Empirical results across several randomized experiments show that our estimator offers substantial precision gains, equivalent to a reduction of up to 20% in the sample size needed to match the same precision as the standard estimator based on experimental data alone.
- Abstract(参考訳): ランダム化実験は介入の効果を評価するのに好まれる手法であるが、コストがかかり、かなりの不確実性のある見積もりが得られることが多い。
一方、基礎モデルを利用したシリコ実験では、コスト効率の良い代替手段が提供され、高い統計精度が得られる可能性がある。
しかし、シリコ実験の利点には重大なリスクが伴う: 統計的推測は、介入に対する実験的な反応を正確に予測できない場合に有効ではない。
本稿では,複数の基礎モデルからの予測を実験データと統合し,有効な統計的推測を保存した新しい手法を提案する。
我々の推定値は、実験データのみに基づく標準推定値より大きくない、一貫性があり、漸近的に正常である。
重要なことに、これらの統計特性は、モデル予測が任意にバイアスを受けたとしても保持される。
いくつかのランダム化実験における実験結果から, 実験データのみに基づく標準推定値と同じ精度で試料サイズを最大20%削減できるような, 精度の高い推定値が得られることが示された。
関連論文リスト
- Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
本研究では,ラベル付き類似実験を微調整した予測モデルを用いて,ラベル付き実結果を用いた対象実験の因果推論に焦点をあてる。
まず,経験的リスク最小化(ERM)による実結果推定は,対象個体群に対して有効な因果推論を導出できない可能性があることを示す。
本稿では,実証的リスク最小化法(DEM)を提案する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Prediction-Guided Active Experiments [18.494123886098215]
予測誘導能動実験(PGAE)のための新しいフレームワークについて紹介する。
PGAEは、既存の機械学習モデルからの予測を活用して、サンプリングと実験をガイドする。
我々は、PGAEが効率的であり続け、一定の正則性仮定の下で同じ半パラメトリック境界を得ることを示す。
論文 参考訳(メタデータ) (2024-11-18T20:16:24Z) - Evidential time-to-event prediction with calibrated uncertainty quantification [12.446406577462069]
Time-to-event分析は、臨床予後と治療勧告に関する洞察を提供する。
本稿では,時間とイベントの予測に特化して設計された明らかな回帰モデルを提案する。
我々のモデルは正確かつ信頼性の高い性能を提供し、最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-11-12T15:06:04Z) - Statistical Inference in Tensor Completion: Optimal Uncertainty Quantification and Statistical-to-Computational Gaps [7.174572371800217]
本稿では,不完全かつノイズの多い観測を用いて,テンソル線形形式を統計的に推定する簡易かつ効率的な手法を提案する。
これは、信頼区間の構築、ヘテロスケダティックおよびサブ指数雑音下での推論、同時テストなど、様々な統計的推論タスクに適している。
論文 参考訳(メタデータ) (2024-10-15T03:09:52Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Expected Validation Performance and Estimation of a Random Variable's
Maximum [48.83713377993604]
予測された検証性能に対する3つの統計的推定器を解析する。
偏りのない推定器は最も分散度が高く、最小分散度を持つ推定器は最大のバイアスを持つ。
2つの偏りのある推定器は、最も少ない誤った結論につながる。
論文 参考訳(メタデータ) (2021-10-01T18:48:47Z) - What can the millions of random treatments in nonexperimental data
reveal about causes? [0.0]
この記事ではこのようなモデルとベイズ的アプローチを紹介し、非経験的データで典型的に使用可能な 1(n2)$ のペアワイズ観測を組み合わせる。
提案手法は, 一般のnswサンプル, 任意のサブポピュレーションおよび大容量スーパーサンプルにおいて, 因果効果を回復することを示す。
論文 参考訳(メタデータ) (2021-05-03T20:13:34Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - Improving Maximum Likelihood Training for Text Generation with Density
Ratio Estimation [51.091890311312085]
本稿では,テキスト生成で遭遇する大規模なサンプル空間において,効率よく安定な自動回帰シーケンス生成モデルのトレーニング手法を提案する。
本手法は,品質と多様性の両面で,最大類似度推定や他の最先端シーケンス生成モデルよりも安定に優れている。
論文 参考訳(メタデータ) (2020-07-12T15:31:24Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。