論文の概要: Safe Tests and Always-Valid Confidence Intervals for contingency tables
and beyond
- arxiv url: http://arxiv.org/abs/2106.02693v1
- Date: Fri, 4 Jun 2021 20:12:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-15 09:04:45.296899
- Title: Safe Tests and Always-Valid Confidence Intervals for contingency tables
and beyond
- Title(参考訳): 緊急時表以降の安全テストと常用信頼区間
- Authors: Rosanne Turner, Alexander Ly, Peter Gr\"unwald
- Abstract要約: 2つのデータストリームが同じソースから来るかどうかをテストするためのE変数を開発します。
これらのE変数は、オプションの停止や継続のようなフレキシブルなサンプリングシナリオの下で、安全であり続けるテストにつながる。
- 参考スコア(独自算出の注目度): 69.25055322530058
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We develop E variables for testing whether two data streams come from the
same source or not, and more generally, whether the difference between the
sources is larger than some minimal effect size. These E variables lead to
tests that remain safe, i.e. keep their Type-I error guarantees, under flexible
sampling scenarios such as optional stopping and continuation. We also develop
the corresponding always-valid confidence intervals. In special cases our E
variables also have an optimal `growth' property under the alternative. We
illustrate the generic construction through the special case of 2x2 contingency
tables, where we also allow for the incorporation of different restrictions on
a composite alternative. Comparison to p-value analysis in simulations and a
real-world example show that E variables, through their flexibility, often
allow for early stopping of data collection, thereby retaining similar power as
classical methods.
- Abstract(参考訳): 2つのデータストリームが同じソースから来るかどうかをテストするためのE変数を開発し、より一般的には、ソース間の差がいくつかの最小効果サイズよりも大きいかどうかをテストする。
これらのE変数は安全であり続けるテストにつながる。
オプションの停止や継続といった柔軟なサンプリングシナリオの下で、type-iのエラー保証を維持する。
また、常に有意な信頼区間も展開する。
特別の場合、E 変数は代替条件の下で最適な '成長' 特性を持つ。
2x2連続テーブルの特別な場合による一般的な構成について説明し、合成代替品に異なる制約を組み込むことも可能である。
シミュレーションと実世界の実例におけるp値解析と比較すると、E変数はその柔軟性を通じて、しばしばデータ収集の早期停止を可能にし、古典的な方法と同じようなパワーを保持する。
関連論文リスト
- Diversity-aware Buffer for Coping with Temporally Correlated Data
Streams in Online Test-time Adaptation [3.1265626879839923]
テストデータストリームは必ずしも独立であり、同じ分散(すなわちd)であるとは限らない。
非i.d.シナリオであっても、i.d.データストリームをシミュレートできるダイバーシティ対応およびカテゴリバランスバッファを提案する。
我々は、最も検討されたベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2024-01-02T01:56:25Z) - Non-Exchangeable Conformal Risk Control [12.381447108228635]
分割共形予測は、公式に保証された不確実性セットや間隔を提供する能力によって、最近大きな関心を集めている。
本研究では,データ交換不能時のモノトーン損失関数の期待値を制御できる非交換型共形リスク制御を提案する。
私たちのフレームワークはフレキシブルで、仮定はごくわずかで、所定のテスト例に対する関連性に基づいてデータを重み付けできます。
論文 参考訳(メタデータ) (2023-10-02T15:00:19Z) - Robust Continual Test-time Adaptation: Instance-aware BN and
Prediction-balanced Memory [58.72445309519892]
テストデータストリーム以外のデータストリームに対して堅牢な新しいテスト時間適応方式を提案する。
a)分布外サンプルの正規化を修正するIABN(Instance-Aware Batch Normalization)と、(b)クラスバランスのない方法で非i.d.ストリームからのデータストリームをシミュレートするPBRS(Predict- Balanced Reservoir Sampling)である。
論文 参考訳(メタデータ) (2022-08-10T03:05:46Z) - Predicting Out-of-Domain Generalization with Neighborhood Invariance [59.05399533508682]
局所変換近傍における分類器の出力不変性の尺度を提案する。
私たちの測度は計算が簡単で、テストポイントの真のラベルに依存しません。
画像分類,感情分析,自然言語推論のベンチマーク実験において,我々の測定値と実際のOOD一般化との間に強い相関関係を示す。
論文 参考訳(メタデータ) (2022-07-05T14:55:16Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - Multivariate Probabilistic Regression with Natural Gradient Boosting [63.58097881421937]
多変量予測分布の条件パラメータを非パラメトリックにモデル化したNatural Gradient Boosting (NGBoost) 手法を提案する。
提案手法は頑健で, 広範囲なチューニングを伴わず, 推定対象分布に対してモジュール構造であり, 既存の手法と比較して競争力がある。
論文 参考訳(メタデータ) (2021-06-07T17:44:49Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - Safe Testing [0.9634859579172255]
e-value に基づいた仮説テスト理論を開発した。
e値に基づくテストは安全、すなわちType-Iエラーの保証を保持する。
論文 参考訳(メタデータ) (2019-06-18T20:39:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。