Fugu-MT 論文翻訳(概要): E-Valuating Classifier Two-Sample Tests

論文の概要: E-Valuating Classifier Two-Sample Tests

arxiv url: http://arxiv.org/abs/2210.13027v1
Date: Mon, 24 Oct 2022 08:18:36 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-25 15:23:00.127124
Title: E-Valuating Classifier Two-Sample Tests
Title（参考訳）: E-Valuating Classifier Two-Sample Tests
Authors: Teodora Pandeva and Tim Bakker and Christian A. Naesseth and Patrick Forr\'e
Abstract要約: E値に基づく高次元データのための2サンプルテストであるE-C2STを提案する。 E-C2STは、分割可能性比テストと予測独立性テストに関する既存の研究のアイデアを組み合わせている。シミュレーションおよび実生活データに対するE-C2STの有用性を実証する。
参考スコア（独自算出の注目度）: 3.036137566312035
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose E-C2ST, a classifier two-sample test for high-dimensional data based on E-values. Compared to $p$-values-based tests, tests with E-values have finite sample guarantees for the type I error. E-C2ST combines ideas from existing work on split likelihood ratio tests and predictive independence testing. The resulting E-values incorporate information about the alternative hypothesis. We demonstrate the utility of E-C2ST on simulated and real-life data. In all experiments, we observe that when going from small to large sample sizes, as expected, E-C2ST starts with lower power compared to other methods but eventually converges towards one. Simultaneously, E-C2ST's type I error stays substantially below the chosen significance level, which is not always the case for the baseline methods. Finally, we use an MRI dataset to demonstrate that multiplying E-values from multiple independently conducted studies leads to a combined E-value that retains the finite sample type I error guarantees while increasing the power.
Abstract（参考訳）: E値に基づく高次元データに対する分類器2サンプルテストであるE-C2STを提案する。 p$-valuesベースのテストと比較すると、E値を持つテストはI型エラーのサンプル保証が有限である。 E-C2STは、分割可能性比テストと予測独立性テストに関する既存の研究のアイデアを組み合わせている。結果のE値には、代替仮説に関する情報が含まれている。シミュレーションおよび実生活データに対するE-C2STの有用性を示す。すべての実験において,E-C2STは他の手法に比べて低出力で開始するが,最終的には1方向に収束する。同時に、e-c2stのtype iエラーは選択された重要度レベルを下回っており、必ずしもベースラインメソッドの場合ではない。最後に、MRIデータセットを用いて、独立に実行される複数の研究からE値を乗算すると、有限サンプルI型エラー保証を保ちながらパワーを増大させるE値が結合されることを実証する。

関連論文リスト

A Sample Efficient Conditional Independence Test in the Presence of Discretization [54.047334792855345]
離散化されたデータに直接条件付き独立テスト(CI)は、誤った結論につながる可能性がある。最近の進歩は、観測データをバイナライズすることで、潜伏変数間の適切なCI関係を推測することを目指している。そこで本研究では,バイナライゼーションプロセスに依存しないサンプル効率のCIテストを提案する。
論文参考訳（メタデータ） (2025-06-10T12:41:26Z)
Advanced Tutorial: Label-Efficient Two-Sample Tests [15.574402626262053]
このチュートリアルでは、アナリストが2つのサンプルから多くの機能を持つコンテキストにおける2サンプルテストについて説明する。機械学習では、アクティブラーニングにおいて同様のシナリオが研究されている。このチュートリアルは、アクティブな学習概念を、このテキスト版コスト設定内での2サンプルテストに拡張する。
論文参考訳（メタデータ） (2025-01-07T06:43:18Z)
A Unified Data Representation Learning for Non-parametric Two-sample Testing [50.27067977793069]
本稿では,表現学習型2サンプルテスト(RL-TST)フレームワークを提案する。 RL-TSTはまず、データセット全体に対して純粋に自己教師付き表現学習を行う。識別モデルはこれらの赤外線で訓練され、識別表現(DR)を学習する。
論文参考訳（メタデータ） (2024-11-30T23:23:52Z)
Uncertainty-Calibrated Test-Time Model Adaptation without Forgetting [55.17761802332469]
テスト時間適応(TTA)は、与えられたモデルw.r.t.を任意のテストサンプルに適用することにより、トレーニングデータとテストデータの間の潜在的な分散シフトに取り組むことを目指している。事前の手法は各テストサンプルに対してバックプロパゲーションを実行するため、多くのアプリケーションに対して許容できない最適化コストがかかる。本稿では, 有効サンプル選択基準を策定し, 信頼性および非冗長なサンプルを同定する, 効率的なアンチフォッティングテスト時間適応法を提案する。
論文参考訳（メタデータ） (2024-03-18T05:49:45Z)
Deep anytime-valid hypothesis testing [29.273915933729057]
非パラメトリックなテスト問題に対する強力なシーケンシャルな仮説テストを構築するための一般的なフレームワークを提案する。テスト・バイ・ベッティング・フレームワーク内で、機械学習モデルの表現能力を活用するための原則的なアプローチを開発する。合成および実世界のデータセットに関する実証的な結果は、我々の一般的なフレームワークを用いてインスタンス化されたテストが、特殊なベースラインと競合することを示している。
論文参考訳（メタデータ） (2023-10-30T09:46:19Z)
A Comprehensive Survey on Test-Time Adaptation under Distribution Shifts [117.72709110877939]
テスト時間適応(TTA)は、事前訓練されたモデルをテスト中に、予測する前にラベルのないデータに適応する可能性がある。 TTAはテスト時間領域適応、テスト時間バッチ適応、オンラインテスト時間適応といったテストデータの形態に基づいて、いくつかの異なるグループに分類される。
論文参考訳（メタデータ） (2023-03-27T16:32:21Z)
DELTA: degradation-free fully test-time adaptation [59.74287982885375]
テスト時間バッチ正規化(BN)や自己学習といった,一般的な適応手法では,2つの好ましくない欠陥が隠されていることがわかった。まず、テスト時間BNにおける正規化統計は、現在受信されているテストサンプルに完全に影響され、その結果、不正確な推定結果が得られることを明らかにする。第二に、テスト時間適応中にパラメータ更新が支配的なクラスに偏っていることを示す。
論文参考訳（メタデータ） (2023-01-30T15:54:00Z)
Active Sequential Two-Sample Testing [18.99517340397671]
サンプル測定が安価に利用できる新しいシナリオでは,この2サンプルテストの問題を考慮する。我々は,emphactiveNIST-sampleテストフレームワークを考案し,逐次クエリだけでなく,emphactivelyクエリも考案した。実際に、我々はフレームワークのインスタンス化を導入し、いくつかの実験を用いて評価する。
論文参考訳（メタデータ） (2023-01-30T02:23:49Z)
Model-Free Sequential Testing for Conditional Independence via Testing by Betting [8.293345261434943]
提案されたテストでは、任意の依存関係構造を持つ入ってくるi.d.データストリームを分析できる。重要な結果が検出されれば,オンライン上でのデータポイントの処理を可能とし,データ取得を停止する。
論文参考訳（メタデータ） (2022-10-01T20:05:33Z)
Robust Continual Test-time Adaptation: Instance-aware BN and Prediction-balanced Memory [58.72445309519892]
テストデータストリーム以外のデータストリームに対して堅牢な新しいテスト時間適応方式を提案する。 a)分布外サンプルの正規化を修正するIABN(Instance-Aware Batch Normalization)と、(b)クラスバランスのない方法で非i.d.ストリームからのデータストリームをシミュレートするPBRS(Predict- Balanced Reservoir Sampling)である。
論文参考訳（メタデータ） (2022-08-10T03:05:46Z)
Efficient Test-Time Model Adaptation without Forgetting [60.36499845014649]
テストタイム適応は、トレーニングとテストデータの間の潜在的な分散シフトに取り組むことを目指している。信頼性および非冗長なサンプルを同定するためのアクティブなサンプル選択基準を提案する。また、重要なモデルパラメータを劇的な変化から制約するFisher regularizerを導入します。
論文参考訳（メタデータ） (2022-04-06T06:39:40Z)
Listen, Adapt, Better WER: Source-free Single-utterance Test-time Adaptation for Automatic Speech Recognition [65.84978547406753]
Test-time Adaptationは、ソースドメインでトレーニングされたモデルに適応して、テストサンプルの予測を改善することを目的としている。単一発話テスト時間適応 (SUTA) は音声領域における最初のTTA研究である。
論文参考訳（メタデータ） (2022-03-27T06:38:39Z)
An Optimal Witness Function for Two-Sample Testing [13.159512679346685]
証人2サンプルテスト(WiTS)と呼ばれる1次元証人関数に基づくデータ依存テスト統計法を提案する。特性カーネルに基づく WiTS テストは,任意の固定された代替品に対して一貫したものであることを示す。
論文参考訳（メタデータ） (2021-02-10T17:13:21Z)
Two-Sample Testing on Ranked Preference Data and the Role of Modeling Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。私たちのテストでは、基本的に分布に関する仮定は必要ありません。実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文参考訳（メタデータ） (2020-06-21T20:51:09Z)
Double Generative Adversarial Networks for Conditional Independence Testing [8.359770027722275]
高次元条件独立テストは統計学と機械学習の重要な構成要素である。本稿では,GAN(Double Generative Adversarial Network)に基づく推論手法を提案する。
論文参考訳（メタデータ） (2020-06-03T16:14:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。