論文の概要: E-Valuating Classifier Two-Sample Tests
- arxiv url: http://arxiv.org/abs/2210.13027v1
- Date: Mon, 24 Oct 2022 08:18:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 15:23:00.127124
- Title: E-Valuating Classifier Two-Sample Tests
- Title(参考訳): E-Valuating Classifier Two-Sample Tests
- Authors: Teodora Pandeva and Tim Bakker and Christian A. Naesseth and Patrick
Forr\'e
- Abstract要約: E値に基づく高次元データのための2サンプルテストであるE-C2STを提案する。
E-C2STは、分割可能性比テストと予測独立性テストに関する既存の研究のアイデアを組み合わせている。
シミュレーションおよび実生活データに対するE-C2STの有用性を実証する。
- 参考スコア(独自算出の注目度): 3.036137566312035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose E-C2ST, a classifier two-sample test for high-dimensional data
based on E-values. Compared to $p$-values-based tests, tests with E-values have
finite sample guarantees for the type I error. E-C2ST combines ideas from
existing work on split likelihood ratio tests and predictive independence
testing. The resulting E-values incorporate information about the alternative
hypothesis. We demonstrate the utility of E-C2ST on simulated and real-life
data. In all experiments, we observe that when going from small to large sample
sizes, as expected, E-C2ST starts with lower power compared to other methods
but eventually converges towards one. Simultaneously, E-C2ST's type I error
stays substantially below the chosen significance level, which is not always
the case for the baseline methods. Finally, we use an MRI dataset to
demonstrate that multiplying E-values from multiple independently conducted
studies leads to a combined E-value that retains the finite sample type I error
guarantees while increasing the power.
- Abstract(参考訳): E値に基づく高次元データに対する分類器2サンプルテストであるE-C2STを提案する。
p$-valuesベースのテストと比較すると、E値を持つテストはI型エラーのサンプル保証が有限である。
E-C2STは、分割可能性比テストと予測独立性テストに関する既存の研究のアイデアを組み合わせている。
結果のE値には、代替仮説に関する情報が含まれている。
シミュレーションおよび実生活データに対するE-C2STの有用性を示す。
すべての実験において,E-C2STは他の手法に比べて低出力で開始するが,最終的には1方向に収束する。
同時に、e-c2stのtype iエラーは選択された重要度レベルを下回っており、必ずしもベースラインメソッドの場合ではない。
最後に、MRIデータセットを用いて、独立に実行される複数の研究からE値を乗算すると、有限サンプルI型エラー保証を保ちながらパワーを増大させるE値が結合されることを実証する。
関連論文リスト
- Uncertainty-Calibrated Test-Time Model Adaptation without Forgetting [55.17761802332469]
テスト時間適応(TTA)は、与えられたモデルw.r.t.を任意のテストサンプルに適用することにより、トレーニングデータとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
事前の手法は各テストサンプルに対してバックプロパゲーションを実行するため、多くのアプリケーションに対して許容できない最適化コストがかかる。
本稿では, 有効サンプル選択基準を策定し, 信頼性および非冗長なサンプルを同定する, 効率的なアンチフォッティングテスト時間適応法を提案する。
論文 参考訳(メタデータ) (2024-03-18T05:49:45Z) - Deep anytime-valid hypothesis testing [29.273915933729057]
非パラメトリックなテスト問題に対する強力なシーケンシャルな仮説テストを構築するための一般的なフレームワークを提案する。
テスト・バイ・ベッティング・フレームワーク内で、機械学習モデルの表現能力を活用するための原則的なアプローチを開発する。
合成および実世界のデータセットに関する実証的な結果は、我々の一般的なフレームワークを用いてインスタンス化されたテストが、特殊なベースラインと競合することを示している。
論文 参考訳(メタデータ) (2023-10-30T09:46:19Z) - DELTA: degradation-free fully test-time adaptation [59.74287982885375]
テスト時間バッチ正規化(BN)や自己学習といった,一般的な適応手法では,2つの好ましくない欠陥が隠されていることがわかった。
まず、テスト時間BNにおける正規化統計は、現在受信されているテストサンプルに完全に影響され、その結果、不正確な推定結果が得られることを明らかにする。
第二に、テスト時間適応中にパラメータ更新が支配的なクラスに偏っていることを示す。
論文 参考訳(メタデータ) (2023-01-30T15:54:00Z) - Active Sequential Two-Sample Testing [18.99517340397671]
サンプル測定が安価に利用できる新しいシナリオでは,この2サンプルテストの問題を考慮する。
我々は,emphactiveNIST-sampleテストフレームワークを考案し,逐次クエリだけでなく,emphactivelyクエリも考案した。
実際に、我々はフレームワークのインスタンス化を導入し、いくつかの実験を用いて評価する。
論文 参考訳(メタデータ) (2023-01-30T02:23:49Z) - Model-Free Sequential Testing for Conditional Independence via Testing
by Betting [8.293345261434943]
提案されたテストでは、任意の依存関係構造を持つ入ってくるi.d.データストリームを分析できる。
重要な結果が検出されれば,オンライン上でのデータポイントの処理を可能とし,データ取得を停止する。
論文 参考訳(メタデータ) (2022-10-01T20:05:33Z) - Robust Continual Test-time Adaptation: Instance-aware BN and
Prediction-balanced Memory [58.72445309519892]
テストデータストリーム以外のデータストリームに対して堅牢な新しいテスト時間適応方式を提案する。
a)分布外サンプルの正規化を修正するIABN(Instance-Aware Batch Normalization)と、(b)クラスバランスのない方法で非i.d.ストリームからのデータストリームをシミュレートするPBRS(Predict- Balanced Reservoir Sampling)である。
論文 参考訳(メタデータ) (2022-08-10T03:05:46Z) - Efficient Test-Time Model Adaptation without Forgetting [60.36499845014649]
テストタイム適応は、トレーニングとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
信頼性および非冗長なサンプルを同定するためのアクティブなサンプル選択基準を提案する。
また、重要なモデルパラメータを劇的な変化から制約するFisher regularizerを導入します。
論文 参考訳(メタデータ) (2022-04-06T06:39:40Z) - Listen, Adapt, Better WER: Source-free Single-utterance Test-time
Adaptation for Automatic Speech Recognition [65.84978547406753]
Test-time Adaptationは、ソースドメインでトレーニングされたモデルに適応して、テストサンプルの予測を改善することを目的としている。
単一発話テスト時間適応 (SUTA) は音声領域における最初のTTA研究である。
論文 参考訳(メタデータ) (2022-03-27T06:38:39Z) - An Optimal Witness Function for Two-Sample Testing [13.159512679346685]
証人2サンプルテスト(WiTS)と呼ばれる1次元証人関数に基づくデータ依存テスト統計法を提案する。
特性カーネルに基づく WiTS テストは,任意の固定された代替品に対して一貫したものであることを示す。
論文 参考訳(メタデータ) (2021-02-10T17:13:21Z) - Two-Sample Testing on Ranked Preference Data and the Role of Modeling
Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。
私たちのテストでは、基本的に分布に関する仮定は必要ありません。
実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文 参考訳(メタデータ) (2020-06-21T20:51:09Z) - Double Generative Adversarial Networks for Conditional Independence
Testing [8.359770027722275]
高次元条件独立テストは統計学と機械学習の重要な構成要素である。
本稿では,GAN(Double Generative Adversarial Network)に基づく推論手法を提案する。
論文 参考訳(メタデータ) (2020-06-03T16:14:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。