論文の概要: Cost-aware Generalized $\alpha$-investing for Multiple Hypothesis
Testing
- arxiv url: http://arxiv.org/abs/2210.17514v3
- Date: Fri, 3 Nov 2023 15:55:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-06 18:28:30.418692
- Title: Cost-aware Generalized $\alpha$-investing for Multiple Hypothesis
Testing
- Title(参考訳): 複数仮説検定のためのコスト認識一般$\alpha$-investing
- Authors: Thomas Cook and Harsh Vardhan Dubey and Ji Ah Lee and Guangyu Zhu and
Tingting Zhao and Patrick Flaherty
- Abstract要約: 非自明なデータ収集コストを伴う逐次多重仮説テストの問題点を考察する。
この問題は、病気の過程の異なる発現遺伝子を識別するための生物学的実験を行うときに発生する。
我々は,$alpha$-wealthの長期的挙動を理論的に分析し,$alpha$-investing決定規則のサンプルサイズを考慮した。
- 参考スコア(独自算出の注目度): 5.521213530218833
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of sequential multiple hypothesis testing with
nontrivial data collection costs. This problem appears, for example, when
conducting biological experiments to identify differentially expressed genes of
a disease process. This work builds on the generalized $\alpha$-investing
framework which enables control of the false discovery rate in a sequential
testing setting. We make a theoretical analysis of the long term asymptotic
behavior of $\alpha$-wealth which motivates a consideration of sample size in
the $\alpha$-investing decision rule. Posing the testing process as a game with
nature, we construct a decision rule that optimizes the expected
$\alpha$-wealth reward (ERO) and provides an optimal sample size for each test.
Empirical results show that a cost-aware ERO decision rule correctly rejects
more false null hypotheses than other methods for $n=1$ where $n$ is the sample
size. When the sample size is not fixed cost-aware ERO uses a prior on the null
hypothesis to adaptively allocate of the sample budget to each test. We extend
cost-aware ERO investing to finite-horizon testing which enables the decision
rule to allocate samples in a non-myopic manner. Finally, empirical tests on
real data sets from biological experiments show that cost-aware ERO balances
the allocation of samples to an individual test against the allocation of
samples across multiple tests.
- Abstract(参考訳): 非自明なデータ収集コストを伴う逐次多重仮説テストの問題を考える。
この問題は、例えば、病気過程の異なる発現遺伝子を同定するための生物学的実験を行う際に現れる。
この作業は、シーケンシャルなテスト環境での偽発見率の制御を可能にする一般的な$\alpha$-investingフレームワーク上に構築されている。
我々は,$\alpha$-wealth の長期漸近的挙動を理論的に解析し,$\alpha$-investing 決定規則におけるサンプルサイズについて考察する。
テストプロセスを自然とゲームとして構成することで、期待される$\alpha$-wealth reward(ero)を最適化し、各テストに最適なサンプルサイズを提供する決定ルールを構築します。
実証的な結果は、コストを意識したERO決定規則が、$n=1$の他のメソッドよりも偽のnull仮説を正しく拒否することを示している。
サンプルサイズが固定コストでない場合、EROはヌル仮説の先行値を使用して各テストにサンプル予算を適応的に割り当てる。
コストを考慮したERO投資を有限水平試験に拡張し、決定ルールが標本を非筋電図的に割り当てることを可能にする。
最後に、生物学的実験からの実際のデータセットに関する実証テストでは、コストを認識できるeroが複数のテストでサンプルの割り当てに対して個々のテストにサンプルの割り当てをバランスしていることが示されている。
関連論文リスト
- Robust Non-adaptive Group Testing under Errors in Group Membership Specifications [3.554868356768806]
グループテスト(GT)は、$n p$ group'でテストを実行することで欠陥状態を決定することを目的としており、$p$サンプルのサブセットを混合してグループを形成する。
しかし、既存の方法の多くは、グループメンバーシップが正確に指定されていると仮定している。
本稿では,グループメンバシップ仕様の誤りを処理できる新しいGT法であるDebiased Robust Lasso Test Method (DRLT) を提案する。
論文 参考訳(メタデータ) (2024-09-09T06:03:23Z) - Doubly Robust Conditional Independence Testing with Generative Neural Networks [8.323172773256449]
本稿では、第3の確率ベクトル$Z$を与えられた2つのジェネリックランダムベクトル$X$と$Y$の条件独立性をテストする問題に対処する。
条件分布を明示的に推定しない新しい非パラメトリック試験法を提案する。
論文 参考訳(メタデータ) (2024-07-25T01:28:59Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Active Sequential Two-Sample Testing [18.99517340397671]
サンプル測定が安価に利用できる新しいシナリオでは,この2サンプルテストの問題を考慮する。
我々は,emphactiveNIST-sampleテストフレームワークを考案し,逐次クエリだけでなく,emphactivelyクエリも考案した。
実際に、我々はフレームワークのインスタンス化を導入し、いくつかの実験を用いて評価する。
論文 参考訳(メタデータ) (2023-01-30T02:23:49Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Boost Test-Time Performance with Closed-Loop Inference [85.43516360332646]
そこで本研究では,モデル性能を高めるために,ループ方式でハードクラス化試験サンプルを予測することを提案する。
まず、追加の推論ループを必要とするハードクラス化テストサンプルを識別するためにフィルタリング基準を考案する。
各ハードサンプルに対して、モデルのキャリブレーションを行うために、元の上位$K$予測に基づいて補助学習タスクを構築する。
論文 参考訳(メタデータ) (2022-03-21T10:20:21Z) - The Sample Complexity of Robust Covariance Testing [56.98280399449707]
i. i. d.
形式 $Z = (1-epsilon) X + epsilon B$ の分布からのサンプル。ここで $X$ はゼロ平均で未知の共分散である Gaussian $mathcalN(0, Sigma)$ である。
汚染がない場合、事前の研究は、$O(d)$サンプルを使用するこの仮説テストタスクの単純なテスターを与えた。
サンプル複雑性の上限が $omega(d2)$ for $epsilon$ an arbitrarily small constant and $gamma であることを証明します。
論文 参考訳(メタデータ) (2020-12-31T18:24:41Z) - Optimal Testing of Discrete Distributions with High Probability [49.19942805582874]
高確率状態に着目して離散分布を試験する問題について検討する。
一定の要素でサンプル最適である近接性および独立性テストのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-14T16:09:17Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z) - Nonparametric Inference under B-bits Quantization [5.958064620718292]
そこで本研究では,B$ビットに量子化されたサンプルに基づく非パラメトリック試験手法を提案する。
特に、B$が一定の閾値を超えると、提案した非パラメトリックテスト手順が古典的なミニマックステスト率を達成することを示す。
論文 参考訳(メタデータ) (2019-01-24T18:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。