論文の概要: Safe Testing
- arxiv url: http://arxiv.org/abs/1906.07801v5
- Date: Fri, 10 Mar 2023 13:14:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-31 18:55:10.848617
- Title: Safe Testing
- Title(参考訳): 安全なテスト
- Authors: Peter Gr\"unwald, Rianne de Heide, and Wouter Koolen
- Abstract要約: e-value に基づいた仮説テスト理論を開発した。
e値に基づくテストは安全、すなわちType-Iエラーの保証を保持する。
- 参考スコア(独自算出の注目度): 0.9634859579172255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop the theory of hypothesis testing based on the e-value, a notion of
evidence that, unlike the p-value, allows for effortlessly combining results
from several studies in the common scenario where the decision to perform a new
study may depend on previous outcomes. Tests based on e-values are safe, i.e.
they preserve Type-I error guarantees, under such optional continuation. We
define growth-rate optimality (GRO) as an analogue of power in an optional
continuation context, and we show how to construct GRO e-variables for general
testing problems with composite null and alternative, emphasizing models with
nuisance parameters. GRO e-values take the form of Bayes factors with special
priors. We illustrate the theory using several classic examples including a
one-sample safe t-test and the 2 x 2 contingency table. Sharing Fisherian,
Neymanian and Jeffreys-Bayesian interpretations, e-values may provide a
methodology acceptable to adherents of all three schools.
- Abstract(参考訳): 仮説検定の理論をe値に基づいて展開し,p値と異なり,新たな研究を行う決定が過去の結果に依存するという共通シナリオにおいて,複数の研究から得られた成果を無益に結合できる証拠の概念を考案する。
e値に基づくテストは安全、すなわち、そのような任意の継続の下でType-Iエラーを保証する。
成長速度最適性 (gro) を任意の継続文脈におけるパワーの類似として定義し, 複合ヌルおよび代替テスト問題に対するgro e-変数の構成法を示し, ニュアサンスパラメータを持つモデルを強調する。
GRO e-values は特別な前兆を持つベイズ因子の形式をとる。
一つのサンプルセーフt検定と2 x 2検定表を含む古典的な例を用いてこの理論を説明する。
フィッシャー学派、ネイマン学派、ジェフリーズ・ベイズ学派の解釈を共有することで、e-valuesは3つの流派の支持者に受け入れられる方法論を提供することができる。
関連論文リスト
- Conformal Generative Modeling with Improved Sample Efficiency through Sequential Greedy Filtering [55.15192437680943]
生成モデルは出力に対する厳密な統計的保証を欠いている。
厳密な統計的保証を満たす予測セットを生成する逐次共形予測法を提案する。
このことは、高い確率で予測セットが少なくとも1つの許容可能な(または有効な)例を含むことを保証している。
論文 参考訳(メタデータ) (2024-10-02T15:26:52Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Sequential Permutation Testing of Random Forest Variable Importance
Measures [68.8204255655161]
そこで本研究では、逐次置換テストと逐次p値推定を用いて、従来の置換テストに関連する高い計算コストを削減することを提案する。
シミュレーション研究の結果、シーケンシャルテストの理論的性質が当てはまることを確認した。
本手法の数値安定性を2つの応用研究で検討した。
論文 参考訳(メタデータ) (2022-06-02T20:16:50Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - Safe Tests and Always-Valid Confidence Intervals for contingency tables
and beyond [69.25055322530058]
2つのデータストリームが同じソースから来るかどうかをテストするためのE変数を開発します。
これらのE変数は、オプションの停止や継続のようなフレキシブルなサンプリングシナリオの下で、安全であり続けるテストにつながる。
論文 参考訳(メタデータ) (2021-06-04T20:12:13Z) - On Model Identification and Out-of-Sample Prediction of Principal
Component Regression: Applications to Synthetic Controls [20.96904429337912]
固定設計による高次元誤差変数設定における主成分回帰(PCR)の解析を行う。
我々は、最もよく知られたレートで改善される非漸近的なアウト・オブ・サンプル予測の保証を確立する。
論文 参考訳(メタデータ) (2020-10-27T17:07:36Z) - Achieving Equalized Odds by Resampling Sensitive Attributes [13.114114427206678]
等価性の概念をほぼ満足する予測モデルを学習するためのフレキシブルなフレームワークを提案する。
この微分可能な関数は、モデルパラメータを等化奇数に向けて駆動するペナルティとして使用される。
本研究は,予測規則が本性質に反するか否かを検出するための公式な仮説テストを開発する。
論文 参考訳(メタデータ) (2020-06-08T00:18:34Z) - Double Generative Adversarial Networks for Conditional Independence
Testing [8.359770027722275]
高次元条件独立テストは統計学と機械学習の重要な構成要素である。
本稿では,GAN(Double Generative Adversarial Network)に基づく推論手法を提案する。
論文 参考訳(メタデータ) (2020-06-03T16:14:15Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。