論文の概要: Estimating the number and effect sizes of non-null hypotheses
- arxiv url: http://arxiv.org/abs/2002.07297v2
- Date: Fri, 24 Jul 2020 18:26:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 12:17:05.956895
- Title: Estimating the number and effect sizes of non-null hypotheses
- Title(参考訳): 非null仮説の数と効果の大きさの推定
- Authors: Jennifer Brennan, Ramya Korlakai Vinayak and Kevin Jamieson
- Abstract要約: 効果の大きさの分布を知ることで、実験的な設計のパワー(タイプIIエラー)を計算することができる。
我々の推定器は、将来の実験で与えられた実験設計を用いて行われる発見の数を保証するために使用できる。
- 参考スコア(独自算出の注目度): 14.34147140416535
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of estimating the distribution of effect sizes (the mean
of the test statistic under the alternate hypothesis) in a multiple testing
setting. Knowing this distribution allows us to calculate the power (type II
error) of any experimental design. We show that it is possible to estimate this
distribution using an inexpensive pilot experiment, which takes significantly
fewer samples than would be required by an experiment that identified the
discoveries. Our estimator can be used to guarantee the number of discoveries
that will be made using a given experimental design in a future experiment. We
prove that this simple and computationally efficient estimator enjoys a number
of favorable theoretical properties, and demonstrate its effectiveness on data
from a gene knockout experiment on influenza inhibition in Drosophila.
- Abstract(参考訳): 本研究では,複数のテスト環境における効果量分布(代替仮説に基づくテスト統計の平均値)を推定する問題について検討する。
この分布を知ることで、実験的な設計のパワー(タイプIIエラー)を計算することができる。
この分布を安価なパイロット実験で推定することは可能であり, 発見を同定する実験で必要となる試料よりはるかに少ない試料を採取できることを示した。
我々の推定器は、将来の実験で与えられた実験設計を用いて行われる発見の数を保証するために使用できる。
この単純で計算効率の良い推定器は、多くの理論的性質を享受し、ショウジョウバエのインフルエンザ抑制に関する遺伝子ノックアウト実験のデータによる効果を実証する。
関連論文リスト
- Variance reduction combining pre-experiment and in-experiment data [0.0]
オンライン制御実験(A/Bテスト)は、多くの企業にとって、データ駆動による意思決定に不可欠である。
CUPEDやCUPACのような既存の手法では、実験前のデータを使って分散を減らすが、その効果は実験前のデータと結果の相関に依存する。
実験前データと実験内データを組み合わせて, CUPED や CUPAC よりも高分散化を実現する手法を提案する。
論文 参考訳(メタデータ) (2024-10-11T17:45:29Z) - A Double Machine Learning Approach to Combining Experimental and Observational Data [59.29868677652324]
実験と観測を組み合わせた二重機械学習手法を提案する。
我々の枠組みは、より軽度の仮定の下で、外部の妥当性と無知の違反を検査する。
論文 参考訳(メタデータ) (2023-07-04T02:53:11Z) - Detecting Adversarial Data by Probing Multiple Perturbations Using
Expected Perturbation Score [62.54911162109439]
逆方向検出は、自然分布と逆方向分布の差に基づいて、与えられたサンプルが逆方向であるかどうかを判定することを目的としている。
本研究では,様々な摂動後の標本の予測スコアであるEPS(pre expected perturbation score)を提案する。
EPSに基づく最大平均誤差(MMD)を,試験試料と自然試料との差を測定する指標として開発する。
論文 参考訳(メタデータ) (2023-05-25T13:14:58Z) - Robust Bayesian Subspace Identification for Small Data Sets [91.3755431537592]
分散効果を低減するため,正規化推定器,縮小推定器,ベイズ推定器を提案する。
実験の結果,提案した推定器は従来の部分空間法よりも40%のコストで推定リスクを低減できることがわかった。
論文 参考訳(メタデータ) (2022-12-29T00:29:04Z) - Probabilities of Causation: Adequate Size of Experimental and
Observational Samples [17.565045120151865]
テアンとパールは, 必要十分性(PNS), 十分性(PS), 必要性(PN)について, 実験的および観察的データを用いて, 鋭い境界を導出した。
この仮定は、実験的な分布と観測的な分布を正確に推定するために十分な量のサンプルを保有しているというものである。
本稿では、所定の信頼区間(CI)が特定された場合に、そのような推定に必要なサンプルサイズを決定する方法を提案する。
論文 参考訳(メタデータ) (2022-10-10T21:59:49Z) - Classical models may be a better explanation of the Jiuzhang 1.0
Gaussian Boson Sampler than its targeted squeezed light model [0.0]
我々は、Juzhang 1.0 と Jiuzhang 2.0 の実験の検証のための代替古典的仮説を提案する。
その結果,今後のGBS実験の検証において考慮すべき新たな仮説が得られた。
論文 参考訳(メタデータ) (2022-07-20T17:39:44Z) - Variance Minimization in the Wasserstein Space for Invariant Causal
Prediction [72.13445677280792]
そこで本研究では,ICPで行ったアプローチを,予測器数で線形にスケールする一連の非パラメトリックテストとして再検討する。
これらのテストはそれぞれ、最適輸送理論の道具から導かれる新しい損失関数の最小化に依存している。
我々は,本手法が同定可能な直接原因の集合を回復できるという軽微な仮定の下で証明し,他のベンチマーク因果探索アルゴリズムと競合することを示す。
論文 参考訳(メタデータ) (2021-10-13T22:30:47Z) - What can the millions of random treatments in nonexperimental data
reveal about causes? [0.0]
この記事ではこのようなモデルとベイズ的アプローチを紹介し、非経験的データで典型的に使用可能な 1(n2)$ のペアワイズ観測を組み合わせる。
提案手法は, 一般のnswサンプル, 任意のサブポピュレーションおよび大容量スーパーサンプルにおいて, 因果効果を回復することを示す。
論文 参考訳(メタデータ) (2021-05-03T20:13:34Z) - With Little Power Comes Great Responsibility [54.96675741328462]
アンダーパワー実験により、統計的ノイズと有意義なモデル改善の違いを識別することがより困難になる。
小さなテストセットは、ほとんどの試行錯誤が、最先端のモデルと比較しても、十分なパワーが得られないことを意味している。
機械翻訳では,2000文の典型的テストセットが約75%のパワーで1 BLEU点の差を検出する。
論文 参考訳(メタデータ) (2020-10-13T18:00:02Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Efficient Adaptive Experimental Design for Average Treatment Effect
Estimation [18.027128141189355]
本研究では, 依存サンプルから構築した推定器を用いた効率的な実験法を提案する。
提案手法を正当化するために,有限および無限サンプル解析を行う。
論文 参考訳(メタデータ) (2020-02-13T02:04:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。