論文の概要: Active Sequential Two-Sample Testing
- arxiv url: http://arxiv.org/abs/2301.12616v1
- Date: Mon, 30 Jan 2023 02:23:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 15:52:14.116180
- Title: Active Sequential Two-Sample Testing
- Title(参考訳): アクティブシーケンシャル2サンプルテスト
- Authors: Weizhi Li, Karthikeyan Natesan Ramamurthy, Prad Kadambi, Pouria Saidi,
Gautam Dasarathy, Visar Berisha
- Abstract要約: 2つのサンプルを生成する分布が同一かどうかを2サンプルテストで検証した。
サンプル測定(またはサンプル特徴)が安価にアクセスできるが、グループメンバーシップ(またはラベル)が高価である新しいシナリオにおいて、この2サンプルテストの問題を提起する。
そこで本研究では,サンプルラベルを逐次的にクエリして問題に対処する,最初のEmphactive two-sampleテストフレームワークを考案した。
- 参考スコア(独自算出の注目度): 24.913240851698045
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Two-sample testing tests whether the distributions generating two samples are
identical. We pose the two-sample testing problem in a new scenario where the
sample measurements (or sample features) are inexpensive to access, but their
group memberships (or labels) are costly. We devise the first \emph{active
sequential two-sample testing framework} that not only sequentially but also
\emph{actively queries} sample labels to address the problem. Our test
statistic is a likelihood ratio where one likelihood is found by maximization
over all class priors, and the other is given by a classification model. The
classification model is adaptively updated and then used to guide an active
query scheme called bimodal query to label sample features in the regions with
high dependency between the feature variables and the label variables. The
theoretical contributions in the paper include proof that our framework
produces an \emph{anytime-valid} $p$-value; and, under reachable conditions and
a mild assumption, the framework asymptotically generates a minimum normalized
log-likelihood ratio statistic that a passive query scheme can only achieve
when the feature variable and the label variable have the highest dependence.
Lastly, we provide a \emph{query-switching (QS)} algorithm to decide when to
switch from passive query to active query and adapt bimodal query to increase
the testing power of our test. Extensive experiments justify our theoretical
contributions and the effectiveness of QS.
- Abstract(参考訳): 2つのサンプルを生成する分布が同一かどうかを2サンプルでテストした。
サンプル測定(またはサンプル特徴)が安価にアクセスできるが、グループメンバーシップ(またはラベル)が高価である新しいシナリオにおいて、2サンプルテストの問題を提起する。
この問題に対処するために,最初の \emph{active sequential two-sample testing framework} を逐次的だけでなく, \emph{actively query} サンプルラベルも考案した。
我々のテスト統計は、全てのクラス前の最大化によって1つの確率が見つかる確率比であり、もう1つは分類モデルによって与えられる。
分類モデルは適応的に更新され、次にbimodal queryと呼ばれるアクティブなクエリスキームを導いて、特徴変数とラベル変数の間に高い依存性を持つ領域のサンプルフィーチャをラベル付けする。
本論文の理論的貢献は,我々のフレームワークが<emph{anytime-valid} $p$-value</e>を生成すること,そして,到達可能な条件と軽微な仮定の下で,このフレームワークは,特徴変数とラベル変数が最も依存度が高い場合にのみ,受動的クエリスキームが達成できる最小正規化対数比統計を漸近的に生成する。
最後に、受動的クエリからアクティブクエリにいつ切り替えるかを判断し、バイモーダルクエリを適用してテストの試験能力を高めるために、 \emph{query-switching (QS)アルゴリズムを提供する。
広範な実験は、理論的な貢献とqsの有効性を正当化する。
関連論文リスト
- Model Equality Testing: Which Model Is This API Serving? [59.005869726179455]
2サンプルテスト問題であるモデル品質テストのような歪みの検出を形式化する。
単純な文字列カーネル上に構築されたテストは、歪みの範囲に対して77.4%の中央値を達成する。
次に、このテストを4つのLlamaモデルの商用推論APIに適用し、31のエンドポイントのうち11がMetaがリリースしたリファレンスウェイトとは異なる分布を提供することがわかった。
論文 参考訳(メタデータ) (2024-10-26T18:34:53Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Deep anytime-valid hypothesis testing [29.273915933729057]
非パラメトリックなテスト問題に対する強力なシーケンシャルな仮説テストを構築するための一般的なフレームワークを提案する。
テスト・バイ・ベッティング・フレームワーク内で、機械学習モデルの表現能力を活用するための原則的なアプローチを開発する。
合成および実世界のデータセットに関する実証的な結果は、我々の一般的なフレームワークを用いてインスタンス化されたテストが、特殊なベースラインと競合することを示している。
論文 参考訳(メタデータ) (2023-10-30T09:46:19Z) - Sequential Predictive Two-Sample and Independence Testing [114.4130718687858]
逐次的非パラメトリック2サンプルテストと独立テストの問題点について検討する。
私たちは賭けによる(非パラメトリックな)テストの原則に基づいています。
論文 参考訳(メタデータ) (2023-04-29T01:30:33Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Model-Free Sequential Testing for Conditional Independence via Testing
by Betting [8.293345261434943]
提案されたテストでは、任意の依存関係構造を持つ入ってくるi.d.データストリームを分析できる。
重要な結果が検出されれば,オンライン上でのデータポイントの処理を可能とし,データ取得を停止する。
論文 参考訳(メタデータ) (2022-10-01T20:05:33Z) - Label efficient two-sample test [39.0914588747459]
2サンプル試験は、2つのサンプルが同じ分布(ヌル仮説)または2つの異なる分布(代替仮説)の実現であるかどうかを評価する。
本稿では,古典的な2サンプルテスト問題におけるこの重要な変化を,2サンプルテストの実行に供する少数のサンプルのラベルを取得する問題として考察する。
まず、ラベルの後方確率をモデル化するための一様ラベル付きサンプルを用いて分類器を訓練し、次に、emphbimodal queryと呼ばれる革新的なクエリスキームを用いてラベルを問合せする。
論文 参考訳(メタデータ) (2021-11-17T01:55:01Z) - Significance tests of feature relevance for a blackbox learner [6.72450543613463]
ブラックボックス学習者の特徴関連性に関する2つの一貫した試験を導出する。
第1は、推論サンプルの摂動による損失差を評価する。
2つ目は推論サンプルを2つに分割するが、データの摂動は必要ない。
論文 参考訳(メタデータ) (2021-03-02T00:59:19Z) - Two-Sample Testing on Ranked Preference Data and the Role of Modeling
Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。
私たちのテストでは、基本的に分布に関する仮定は必要ありません。
実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文 参考訳(メタデータ) (2020-06-21T20:51:09Z) - Double Generative Adversarial Networks for Conditional Independence
Testing [8.359770027722275]
高次元条件独立テストは統計学と機械学習の重要な構成要素である。
本稿では,GAN(Double Generative Adversarial Network)に基づく推論手法を提案する。
論文 参考訳(メタデータ) (2020-06-03T16:14:15Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。