Fugu-MT 論文翻訳(概要): Efficient Randomized Experiments Using Foundation Models

論文の概要: Efficient Randomized Experiments Using Foundation Models

arxiv url: http://arxiv.org/abs/2502.04262v1
Date: Thu, 06 Feb 2025 17:54:10 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-07 15:30:40.8915
Title: Efficient Randomized Experiments Using Foundation Models
Title（参考訳）: 基礎モデルを用いた効率的なランダム化実験
Authors: Piersilvio De Bartolomeis, Javier Abad, Guanbo Wang, Konstantin Donhauser, Raymond M. Duch, Fanny Yang, Issa J. Dahabreh,
Abstract要約: 本稿では,複数の基礎モデルからの予測を,統計的に妥当な推測を保ちながら統合する手法を提案する。我々の推定器は、実験データのみに基づく標準推定器と同じ精度のサンプルサイズを最大20%削減する、かなり精度の高いゲインを提供する。
参考スコア（独自算出の注目度）: 10.606998433337894
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Randomized experiments are the preferred approach for evaluating the effects of interventions, but they are costly and often yield estimates with substantial uncertainty. On the other hand, in silico experiments leveraging foundation models offer a cost-effective alternative that can potentially attain higher statistical precision. However, the benefits of in silico experiments come with a significant risk: statistical inferences are not valid if the models fail to accurately predict experimental responses to interventions. In this paper, we propose a novel approach that integrates the predictions from multiple foundation models with experimental data while preserving valid statistical inference. Our estimator is consistent and asymptotically normal, with asymptotic variance no larger than the standard estimator based on experimental data alone. Importantly, these statistical properties hold even when model predictions are arbitrarily biased. Empirical results across several randomized experiments show that our estimator offers substantial precision gains, equivalent to a reduction of up to 20% in the sample size needed to match the same precision as the standard estimator based on experimental data alone.
Abstract（参考訳）: ランダム化実験は介入の効果を評価するのに好まれる手法であるが、コストがかかり、かなりの不確実性のある見積もりが得られることが多い。一方、基礎モデルを利用したシリコ実験では、コスト効率の良い代替手段が提供され、高い統計精度が得られる可能性がある。しかし、シリコ実験の利点には重大なリスクが伴う: 統計的推測は、介入に対する実験的な反応を正確に予測できない場合に有効ではない。本稿では,複数の基礎モデルからの予測を実験データと統合し,有効な統計的推測を保存した新しい手法を提案する。我々の推定値は、実験データのみに基づく標準推定値より大きくない、一貫性があり、漸近的に正常である。重要なことに、これらの統計特性は、モデル予測が任意にバイアスを受けたとしても保持される。いくつかのランダム化実験における実験結果から, 実験データのみに基づく標準推定値と同じ精度で試料サイズを最大20%削減できるような, 精度の高い推定値が得られることが示された。

関連論文リスト

Detecting and Mitigating Group Bias in Heterogeneous Treatment Effects [28.4891545570248]
ランダム化実験における群バイアスの検出と緩和のための統計的枠組みを開発する。緩和のために、縮退に基づくバイアス補正を提案し、理論的に最適で実証可能な解が閉形式表現を持つことを示す。利益を最大化するパーソナライズターゲティングのための検出されたグループバイアスを緩和することの経済的意味を分析する。
論文参考訳（メタデータ） (2026-02-23T21:47:01Z)
Inference for Batched Adaptive Experiments [0.0]
本報告は適応実験における治療効果の推測のためのBOLS試験統計を示唆する。典型例では, 治療期間が少なく, バッチ当たりの観察回数も少なく, 拒絶率を比較したシミュレーション結果を提供する。
論文参考訳（メタデータ） (2025-12-10T23:33:08Z)
Robust estimation of heterogeneous treatment effects in randomized trials leveraging external data [1.3124513975412255]
本研究では, 条件付き平均治療効果(CATE)を推定するモデル非依存学習者QR-learnerを提案する。外部データが試行に一致していない場合でも、一貫性を維持しながらCATE予測平均2乗誤差を低減することができる。提案手法を実世界のデータセットに適用し,不均一な影響を検出するためのCATE推定と統計的パワーの両方の改善を実証する。
論文参考訳（メタデータ） (2025-07-04T16:01:05Z)
Pre-validation Revisited [79.92204034170092]
シミュレーションと応用による予測,推測,誤差推定における事前検証の特性と利点を示す。そこで本研究では, あるモデル下での事前検証予測のためのテスト統計量の解析的分布だけでなく, 推論を行うための一般的なブートストラップ手順も提案する。
論文参考訳（メタデータ） (2025-05-21T00:20:14Z)
Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
本研究では,ラベル付き類似実験を微調整した予測モデルを用いて,ラベル付き実結果を用いた対象実験の因果推論に焦点をあてる。まず,経験的リスク最小化(ERM)による実結果推定は,対象個体群に対して有効な因果推論を導出できない可能性があることを示す。本稿では,実証的リスク最小化法(DEM)を提案する。
論文参考訳（メタデータ） (2025-02-10T10:52:17Z)
Prediction-Guided Active Experiments [18.494123886098215]
予測誘導能動実験(PGAE)のための新しいフレームワークについて紹介する。 PGAEは、既存の機械学習モデルからの予測を活用して、サンプリングと実験をガイドする。我々は、PGAEが効率的であり続け、一定の正則性仮定の下で同じ半パラメトリック境界を得ることを示す。
論文参考訳（メタデータ） (2024-11-18T20:16:24Z)
Evidential time-to-event prediction with calibrated uncertainty quantification [12.446406577462069]
Time-to-event分析は、臨床予後と治療勧告に関する洞察を提供する。本稿では,時間とイベントの予測に特化して設計された明らかな回帰モデルを提案する。我々のモデルは正確かつ信頼性の高い性能を提供し、最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (2024-11-12T15:06:04Z)
Statistical Inference in Tensor Completion: Optimal Uncertainty Quantification and Statistical-to-Computational Gaps [7.174572371800217]
本稿では,不完全かつノイズの多い観測を用いて,テンソル線形形式を統計的に推定する簡易かつ効率的な手法を提案する。これは、信頼区間の構築、ヘテロスケダティックおよびサブ指数雑音下での推論、同時テストなど、様々な統計的推論タスクに適している。
論文参考訳（メタデータ） (2024-10-15T03:09:52Z)
Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文参考訳（メタデータ） (2023-09-28T13:04:11Z)
Expected Validation Performance and Estimation of a Random Variable's Maximum [48.83713377993604]
予測された検証性能に対する3つの統計的推定器を解析する。偏りのない推定器は最も分散度が高く、最小分散度を持つ推定器は最大のバイアスを持つ。 2つの偏りのある推定器は、最も少ない誤った結論につながる。
論文参考訳（メタデータ） (2021-10-01T18:48:47Z)
What can the millions of random treatments in nonexperimental data reveal about causes? [0.0]
この記事ではこのようなモデルとベイズ的アプローチを紹介し、非経験的データで典型的に使用可能な 1(n2)$ のペアワイズ観測を組み合わせる。提案手法は, 一般のnswサンプル, 任意のサブポピュレーションおよび大容量スーパーサンプルにおいて, 因果効果を回復することを示す。
論文参考訳（メタデータ） (2021-05-03T20:13:34Z)
Increasing the efficiency of randomized trial estimates via linear adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文参考訳（メタデータ） (2020-12-17T21:10:10Z)
Improving Maximum Likelihood Training for Text Generation with Density Ratio Estimation [51.091890311312085]
本稿では,テキスト生成で遭遇する大規模なサンプル空間において,効率よく安定な自動回帰シーケンス生成モデルのトレーニング手法を提案する。本手法は,品質と多様性の両面で,最大類似度推定や他の最先端シーケンス生成モデルよりも安定に優れている。
論文参考訳（メタデータ） (2020-07-12T15:31:24Z)
Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文参考訳（メタデータ） (2020-06-08T07:01:38Z)
Performance metrics for intervention-triggering prediction models do not reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文参考訳（メタデータ） (2020-06-02T16:26:49Z)
Efficient Adaptive Experimental Design for Average Treatment Effect Estimation [20.361745967568154]
適応実験を用いて平均治療効果(ATE)を効率的に推定する方法を検討する。適応実験において、実験者は過去のデータに基づいて治療確率を更新しながら、順次実験単位に治療を割り当てる。提案した設計の任意のラウンドで有効である非パラメトリックおよび非漸近信頼区間を開発する。
論文参考訳（メタデータ） (2020-02-13T02:04:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。