論文の概要: Sequential Predictive Two-Sample and Independence Testing
- arxiv url: http://arxiv.org/abs/2305.00143v2
- Date: Wed, 19 Jul 2023 18:06:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-21 18:07:26.463138
- Title: Sequential Predictive Two-Sample and Independence Testing
- Title(参考訳): 連続予測2サンプルと独立試験
- Authors: Aleksandr Podkopaev, Aaditya Ramdas
- Abstract要約: 逐次的非パラメトリック2サンプルテストと独立テストの問題点について検討する。
私たちは賭けによる(非パラメトリックな)テストの原則に基づいています。
- 参考スコア(独自算出の注目度): 114.4130718687858
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problems of sequential nonparametric two-sample and independence
testing. Sequential tests process data online and allow using observed data to
decide whether to stop and reject the null hypothesis or to collect more data,
while maintaining type I error control. We build upon the principle of
(nonparametric) testing by betting, where a gambler places bets on future
observations and their wealth measures evidence against the null hypothesis.
While recently developed kernel-based betting strategies often work well on
simple distributions, selecting a suitable kernel for high-dimensional or
structured data, such as images, is often nontrivial. To address this drawback,
we design prediction-based betting strategies that rely on the following fact:
if a sequentially updated predictor starts to consistently determine (a) which
distribution an instance is drawn from, or (b) whether an instance is drawn
from the joint distribution or the product of the marginal distributions (the
latter produced by external randomization), it provides evidence against the
two-sample or independence nulls respectively. We empirically demonstrate the
superiority of our tests over kernel-based approaches under structured
settings. Our tests can be applied beyond the case of independent and
identically distributed data, remaining valid and powerful even when the data
distribution drifts over time.
- Abstract(参考訳): 逐次非パラメトリック2サンプルと独立テストの問題点について検討する。
シーケンシャルテストはオンラインでデータを処理し、観測データを使用してヌル仮説を停止または拒否するか、より多くのデータを収集するかを決定する。
我々は賭けによる(非パラメトリックな)テストの原理に基づいており、ギャンブラーは将来の観測に賭け、その富はヌル仮説に対する証拠を測定する。
最近開発されたカーネルベースのベッティング戦略は、単純な分布でよく機能するが、画像のような高次元または構造化データに適したカーネルを選択することは、しばしば簡単ではない。
この欠点に対処するために、我々は次の事実に依存する予測ベースの賭け戦略を設計する。
(a) インスタンスが引き出されるもの,又は
b) インスタンスがジョイント分布またはマージン分布の積から引き出されるか(後者は外部ランダム化によって生成される)、それぞれ2つのサンプルまたは独立ヌルに対する証拠を提供する。
構造化された設定下でのカーネルベースのアプローチよりもテストが優れていることを実証的に示す。
我々のテストは、独立で同一の分散データ以外に適用でき、データ分布が時間とともにドリフトしても有効で強力なままです。
関連論文リスト
- Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Testing Independence of Exchangeable Random Variables [19.973896010415977]
十分なシャッフルデータがあれば、データ項目が統計的に(非)依存しているかどうかを判断できますか?
これは可能であることを示し、データが独立で同一に分散されているというヌル仮説を確実に拒否できるテストを開発する。
潜在的なアプリケーションはDeep Learningで、データはしばしばインターネット全体から取り除かれ、重複は多い。
論文 参考訳(メタデータ) (2022-10-22T08:55:48Z) - Model-Free Sequential Testing for Conditional Independence via Testing
by Betting [8.293345261434943]
提案されたテストでは、任意の依存関係構造を持つ入ってくるi.d.データストリームを分析できる。
重要な結果が検出されれば,オンライン上でのデータポイントの処理を可能とし,データ取得を停止する。
論文 参考訳(メタデータ) (2022-10-01T20:05:33Z) - Robust Continual Test-time Adaptation: Instance-aware BN and
Prediction-balanced Memory [58.72445309519892]
テストデータストリーム以外のデータストリームに対して堅牢な新しいテスト時間適応方式を提案する。
a)分布外サンプルの正規化を修正するIABN(Instance-Aware Batch Normalization)と、(b)クラスバランスのない方法で非i.d.ストリームからのデータストリームをシミュレートするPBRS(Predict- Balanced Reservoir Sampling)である。
論文 参考訳(メタデータ) (2022-08-10T03:05:46Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Context-Aware Drift Detection [0.0]
均質性の2サンプル試験は、既存のドリフト検出手法が構築される基礎となる。
条件分布処理効果の2サンプル試験の基礎の上に構築した,より一般的なドリフト検出フレームワークを開発した。
論文 参考訳(メタデータ) (2022-03-16T14:23:02Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Comparing Sequential Forecasters [35.38264087676121]
2つの予測器を考えてみましょう。それぞれが時間とともに一連のイベントを予測します。
オンラインでもポストホックでも、予測と結果がどのように生成されたかの検証不可能な仮定を避けながら、これらの予測をどのように比較すればよいのか?
予測スコアの時間差を推定するための新しい逐次推論手法を提案する。
実世界の野球と天気予報機を比較することで,我々のアプローチを実証的に検証する。
論文 参考訳(メタデータ) (2021-09-30T22:54:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。