論文の概要: Near-Optimal Non-Parametric Sequential Tests and Confidence Sequences
with Possibly Dependent Observations
- arxiv url: http://arxiv.org/abs/2212.14411v2
- Date: Sat, 15 Jul 2023 15:42:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 23:40:02.200978
- Title: Near-Optimal Non-Parametric Sequential Tests and Confidence Sequences
with Possibly Dependent Observations
- Title(参考訳): ほぼ最適非パラメトリックシーケンステストと依存性のある観測による信頼度シーケンス
- Authors: Aurelien Bibaut, Nathan Kallus, Michael Lindon
- Abstract要約: 我々は、一般の非退避時間保証の下で、最初のI型エラーと予測退避時間保証を提供する。
方程式を推定することによって定義されるパラメータの逐次推論に結果を適用する方法を示す。
- 参考スコア(独自算出の注目度): 49.47001933796361
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sequential tests and their implied confidence sequences, which are valid at
arbitrary stopping times, promise flexible statistical inference and on-the-fly
decision making. However, strong guarantees are limited to parametric
sequential tests that under-cover in practice or concentration-bound-based
sequences that over-cover and have suboptimal rejection times. In this work, we
consider \cite{robbins1970boundary}'s delayed-start normal-mixture sequential
probability ratio tests, and we provide the first asymptotic type-I-error and
expected-rejection-time guarantees under general non-parametric data generating
processes, where the asymptotics are indexed by the test's burn-in time. The
type-I-error results primarily leverage a martingale strong invariance
principle and establish that these tests (and their implied confidence
sequences) have type-I error rates approaching a desired $\alpha$-level. The
expected-rejection-time results primarily leverage an identity inspired by
It\^o's lemma and imply that, in certain asymptotic regimes, the expected
rejection time approaches the minimum possible among $\alpha$-level tests. We
show how to apply our results to sequential inference on parameters defined by
estimating equations, such as average treatment effects. Together, our results
establish these (ostensibly parametric) tests as general-purpose,
non-parametric, and near-optimal. We illustrate this via numerical experiments.
- Abstract(参考訳): 任意の停止時間で有効な逐次テストとそのインプリート信頼シーケンスは、柔軟な統計的推測とオンザフライ決定を約束する。
しかし、強い保証は、実際には未発見のパラメトリックシーケンシャルテストや、過剰にカバーし、最適な拒絶時間を持つ濃度境界ベースのシーケンスに限られる。
本研究では, \cite{robbins 1970boundary} の遅延開始正規混合確率比テストについて検討し,一般の非パラメトリックデータ生成プロセスにおいて,漸近的型-i-error と期待-rejection-time の保証を行う。
type-i-errorの結果は、主にmartingaleの強い不変性原理を活用し、これらのテスト(およびそれらの暗黙の信頼度列)が所望の$\alpha$-レベルに近づくtype-iエラー率を持つことを保証する。
期待排除時間の結果は、主に it\^o の補題に触発された同一性を利用しており、特定の漸近的な方法では、期待拒否時間は $\alpha$ レベルのテストの中で最小に近づくことを暗示している。
平均治療効果などの方程式を推定したパラメータの逐次推定に本結果を適用する方法を示す。
この結果から,これらの実験を汎用性,非パラメトリック性,準最適性として確立した。
これを数値実験で説明する。
関連論文リスト
- Conformal Generative Modeling with Improved Sample Efficiency through Sequential Greedy Filtering [55.15192437680943]
生成モデルは出力に対する厳密な統計的保証を欠いている。
厳密な統計的保証を満たす予測セットを生成する逐次共形予測法を提案する。
このことは、高い確率で予測セットが少なくとも1つの許容可能な(または有効な)例を含むことを保証している。
論文 参考訳(メタデータ) (2024-10-02T15:26:52Z) - Mitigating LLM Hallucinations via Conformal Abstention [70.83870602967625]
我々は,大言語モデルが一般ドメインでの応答をいつ無視すべきかを決定するための,原則化された手順を開発する。
我々は、幻覚率(エラー率)の厳密な理論的保証の恩恵を受けるため、共形予測手法を活用して、禁忌手順を開発する。
実験によって得られた共形禁忌法は, 種々の閉書, オープンドメイン生成質問応答データセットに, 幻覚率を確実に拘束する。
論文 参考訳(メタデータ) (2024-04-04T11:32:03Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Sequential Permutation Testing of Random Forest Variable Importance
Measures [68.8204255655161]
そこで本研究では、逐次置換テストと逐次p値推定を用いて、従来の置換テストに関連する高い計算コストを削減することを提案する。
シミュレーション研究の結果、シーケンシャルテストの理論的性質が当てはまることを確認した。
本手法の数値安定性を2つの応用研究で検討した。
論文 参考訳(メタデータ) (2022-06-02T20:16:50Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Comparing Sequential Forecasters [35.38264087676121]
2つの予測器を考えてみましょう。それぞれが時間とともに一連のイベントを予測します。
オンラインでもポストホックでも、予測と結果がどのように生成されたかの検証不可能な仮定を避けながら、これらの予測をどのように比較すればよいのか?
予測スコアの時間差を推定するための新しい逐次推論手法を提案する。
実世界の野球と天気予報機を比較することで,我々のアプローチを実証的に検証する。
論文 参考訳(メタデータ) (2021-09-30T22:54:46Z) - Time-uniform central limit theory and asymptotic confidence sequences [34.00292366598841]
信頼シーケンス(CS)は任意の停止時間に有効な推論を提供し、データに対する「覗き見」に対する罰則を生じさせない。
CSは漸近的ではなく、有限サンプルの保証を楽しむが、上記の信頼区間の広範な適用性はない。
CLTのような汎用性と(漸近的な)時間一様保証に対する漸近的CSは非漸近的妥当性を否定する。
論文 参考訳(メタデータ) (2021-03-11T05:45:35Z) - Asymptotic Validity and Finite-Sample Properties of Approximate Randomization Tests [2.28438857884398]
我々の理論的な重要な貢献は、ノイズレスデータを用いた近似ランダム化テストのサイズと元のランダム化テストのサイズとの差に非漸近的境界を持つことである。
線形回帰における有意性のテストを含むいくつかの例を通して、我々の理論を解説する。
論文 参考訳(メタデータ) (2019-08-12T16:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。