論文の概要: Advanced Tutorial: Label-Efficient Two-Sample Tests
- arxiv url: http://arxiv.org/abs/2501.03568v1
- Date: Tue, 07 Jan 2025 06:43:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-08 15:46:15.684041
- Title: Advanced Tutorial: Label-Efficient Two-Sample Tests
- Title(参考訳): 高度なチュートリアル: ラベル効率の良い2サンプルテスト
- Authors: Weizhi Li, Visar Berisha, Gautam Dasarathy,
- Abstract要約: このチュートリアルでは、アナリストが2つのサンプルから多くの機能を持つコンテキストにおける2サンプルテストについて説明する。
機械学習では、アクティブラーニングにおいて同様のシナリオが研究されている。
このチュートリアルは、アクティブな学習概念を、このテキスト版コスト設定内での2サンプルテストに拡張する。
- 参考スコア(独自算出の注目度): 15.574402626262053
- License:
- Abstract: Hypothesis testing is a statistical inference approach used to determine whether data supports a specific hypothesis. An important type is the two-sample test, which evaluates whether two sets of data points are from identical distributions. This test is widely used, such as by clinical researchers comparing treatment effectiveness. This tutorial explores two-sample testing in a context where an analyst has many features from two samples, but determining the sample membership (or labels) of these features is costly. In machine learning, a similar scenario is studied in active learning. This tutorial extends active learning concepts to two-sample testing within this \textit{label-costly} setting while maintaining statistical validity and high testing power. Additionally, the tutorial discusses practical applications of these label-efficient two-sample tests.
- Abstract(参考訳): 仮説テスト(英: hypothesis testing)は、データが特定の仮説をサポートするかどうかを決定するための統計的推論手法である。
重要なタイプは2サンプルテストであり、2つのデータポイントが同一分布であるかどうかを評価する。
この検査は、臨床研究者による治療効果の比較など、広く用いられている。
このチュートリアルでは、アナリストが2つのサンプルから多くの機能を持つ状況において、2サンプルテストについて検討するが、これらの機能のサンプルメンバシップ(あるいはラベル)を決定するのにコストがかかる。
機械学習では、アクティブラーニングにおいて同様のシナリオが研究されている。
このチュートリアルは、統計的妥当性と高いテスト能力を維持しつつ、この「textit{label-costly}」設定におけるアクティブな学習概念を2サンプルテストに拡張する。
さらに、これらのラベル効率のよい2サンプルテストの実践的応用について論じる。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Training Guarantees of Neural Network Classification Two-Sample Tests by Kernel Analysis [58.435336033383145]
2つのデータセットが同じ分布から来たかどうかを判断するために、ニューラルネットワークの2サンプルテストを構築し、分析する。
NTK2サンプルテストがデータセット間の偏差レベルを検出するのに必要となる、理論的に最小限のトレーニング時間を導出する。
ニューラルネットワークのトレーニングサンプルとテスト評価サンプルが無限に近づくにつれて、ニューラルネットワークの2サンプルテストに関連する統計的パワーは1になる。
論文 参考訳(メタデータ) (2024-07-05T18:41:16Z) - Active Sequential Two-Sample Testing [18.99517340397671]
サンプル測定が安価に利用できる新しいシナリオでは,この2サンプルテストの問題を考慮する。
我々は,emphactiveNIST-sampleテストフレームワークを考案し,逐次クエリだけでなく,emphactivelyクエリも考案した。
実際に、我々はフレームワークのインスタンス化を導入し、いくつかの実験を用いて評価する。
論文 参考訳(メタデータ) (2023-01-30T02:23:49Z) - Two-sample test based on Self-Organizing Maps [68.8204255655161]
機械学習分類器は2サンプル統計テストとして利用することができる。
自己組織化マップは、当初データ視覚化ツールとして考案された次元削減である。
しかし、本来の目的は視覚化であるため、洞察を与えることもできる。
論文 参考訳(メタデータ) (2022-12-17T21:35:47Z) - E-Valuating Classifier Two-Sample Tests [11.248868528186332]
我々のテストは、既存の作業量分割確率比テストと予測独立性テストのアイデアを組み合わせたものです。
得られたE値は、逐次2サンプルテストに適している。
論文 参考訳(メタデータ) (2022-10-24T08:18:36Z) - AutoML Two-Sample Test [13.468660785510945]
我々は、目撃者の関数の平均的な相違をテスト統計として捉えた単純なテストを使用し、二乗損失を最小限にすれば、最適なテスト能力を持つ目撃者につながることを証明します。
我々はPythonパッケージAutotstでAutoMLの2サンプルテストの実装を提供する。
論文 参考訳(メタデータ) (2022-06-17T15:41:07Z) - Label efficient two-sample test [39.0914588747459]
2サンプル試験は、2つのサンプルが同じ分布(ヌル仮説)または2つの異なる分布(代替仮説)の実現であるかどうかを評価する。
本稿では,古典的な2サンプルテスト問題におけるこの重要な変化を,2サンプルテストの実行に供する少数のサンプルのラベルを取得する問題として考察する。
まず、ラベルの後方確率をモデル化するための一様ラベル付きサンプルを用いて分類器を訓練し、次に、emphbimodal queryと呼ばれる革新的なクエリスキームを用いてラベルを問合せする。
論文 参考訳(メタデータ) (2021-11-17T01:55:01Z) - Test-Agnostic Long-Tailed Recognition by Test-Time Aggregating Diverse
Experts with Self-Supervision [85.07855130048951]
本研究では,テスト非依存型ロングテール認識(test-agnostic long-tailed recognition)と呼ばれる,より実践的なタスク設定について検討する。
本稿では,多種多様な専門家に異なるテスト分布を扱うように訓練するTADE(Test-time Aggregating Diverse Experts)と呼ばれる新しい手法を提案する。
理論的には,提案手法は未知のテストクラス分布をシミュレートできることを示す。
論文 参考訳(メタデータ) (2021-07-20T04:10:31Z) - An Optimal Witness Function for Two-Sample Testing [13.159512679346685]
証人2サンプルテスト(WiTS)と呼ばれる1次元証人関数に基づくデータ依存テスト統計法を提案する。
特性カーネルに基づく WiTS テストは,任意の固定された代替品に対して一貫したものであることを示す。
論文 参考訳(メタデータ) (2021-02-10T17:13:21Z) - Two-Sample Testing on Ranked Preference Data and the Role of Modeling
Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。
私たちのテストでは、基本的に分布に関する仮定は必要ありません。
実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文 参考訳(メタデータ) (2020-06-21T20:51:09Z) - Learning Deep Kernels for Non-Parametric Two-Sample Tests [50.92621794426821]
2組のサンプルが同じ分布から引き出されるかどうかを判定するカーネルベースの2サンプルテストのクラスを提案する。
私たちのテストは、テストパワーを最大化するためにトレーニングされたディープニューラルネットワークによってパラメータ化されたカーネルから構築されます。
論文 参考訳(メタデータ) (2020-02-21T03:54:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。