Fugu-MT 論文翻訳(概要): Peeking with PEAK: Sequential, Nonparametric Composite Hypothesis Tests for Means of Multiple Data Streams

論文の概要: Peeking with PEAK: Sequential, Nonparametric Composite Hypothesis Tests for Means of Multiple Data Streams

arxiv url: http://arxiv.org/abs/2402.06122v3
Date: Sun, 2 Jun 2024 22:41:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-04 18:53:33.887296
Title: Peeking with PEAK: Sequential, Nonparametric Composite Hypothesis Tests for Means of Multiple Data Streams
Title（参考訳）: PEAKによるPeeking:複数のデータストリームに対する逐次的・非パラメトリック複合仮説テスト
Authors: Brian Cho, Kyra Gan, Nathan Kallus,
Abstract要約: テストバイベッティングフレームワークの上に構築し、停止時間にまたがる非漸近的な$alpha$レベルのテストを提供します。実験の結果,PEAKは停止前のサンプル数を最大85%削減できることがわかった。
参考スコア（独自算出の注目度）: 38.04922933299814
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a novel nonparametric sequential test for composite hypotheses for means of multiple data streams. Our proposed method, \emph{peeking with expectation-based averaged capital} (PEAK), builds upon the testing-by-betting framework and provides a non-asymptotic $\alpha$-level test across any stopping time. Our contributions are two-fold: (1) we propose a novel betting scheme and provide theoretical guarantees on type-I error control, power, and asymptotic growth rate/$e$-power in the setting of a single data stream; (2) we introduce PEAK, a generalization of this betting scheme to multiple streams, that (i) avoids using wasteful union bounds via averaging, (ii) is a test of power one under mild regularity conditions on the sampling scheme of the streams, and (iii) reduces computational overhead when applying the testing-as-betting approaches for pure-exploration bandit problems. We illustrate the practical benefits of PEAK using both synthetic and real-world HeartSteps datasets. Our experiments show that PEAK provides up to an 85\% reduction in the number of samples before stopping compared to existing stopping rules for pure-exploration bandit problems, and matches the performance of state-of-the-art sequential tests while improving upon computational complexity.
Abstract（参考訳）: 本稿では,複数データストリームを用いた合成仮説のための新しい非パラメトリックシーケンシャルテストを提案する。提案手法は,予測に基づく平均資本(PEAK)を用いたemph{peeking(emph{peeking with expectation-based averaged capital})であり,テスト・バイ・ベッティング・フレームワーク上に構築され,任意の停止時間にわたって,非漸近的な$\alpha$-levelテストを提供する。コントリビューションは2つある:(1)新しいベッティング方式を提案し、単一のデータストリームの設定において、タイプIエラー制御、パワー、および漸近的成長速度/$e$パワーに関する理論的保証を提供する;(2)このベッティング方式を複数のストリームに一般化したPEAKを導入する。 (i)平均化による無駄な組合結束の使用を避けること。 (ii) 流路のサンプリング方式における緩やかな規則性条件下での電力の試験、及び 3)純探索バンディット問題にテスト・アズ・ベッティング・アプローチを適用する際の計算オーバーヘッドを低減する。合成および実世界のHeartStepsデータセットを用いて,PEAKの実用的メリットを説明する。実験の結果, PEAKは, 純探索バンディット問題に対する既存の停止規則と比較して, サンプル数の最大85%削減が可能であり, 計算複雑性を改善しつつ, 最先端のシーケンシャルテストの性能と一致していることがわかった。

関連論文リスト

Closing the Approximation Gap of Partial AUC Optimization: A Tale of Two Formulations [121.39938773554523]
ROC曲線の下の領域(AUC)は、クラス不均衡と決定制約の両方を持つ実世界のシナリオにおける重要な評価指標である。 PAUC最適化の近似ギャップを埋めるために,2つの簡単なインスタンス単位のミニマックス修正を提案する。得られたアルゴリズムは、サンプルサイズと典型的な一方方向と双方向のPAUCに対して$O(-2/3)$の収束率の線形パーイテレーション計算複雑性を享受する。
論文参考訳（メタデータ） (2025-12-01T02:52:33Z)
Minimax-Optimal Two-Sample Test with Sliced Wasserstein [2.019622939313173]
本研究では,スライスされたワッサーシュタイン距離を用いた非パラメトリック2サンプル試験の問題点について検討する。置換に基づくSWテストを提案し,その性能を解析する。
論文参考訳（メタデータ） (2025-10-31T14:20:06Z)
EconProver: Towards More Economical Test-Time Scaling for Automated Theorem Proving [64.15371139980802]
大規模言語モデル(LLM)は、最近、自動定理証明(ATP)の分野を進歩させた。 ATPモデルに対する異なるテスト時間スケーリング戦略は、推論にかなりの計算オーバーヘッドをもたらすことを示す。本稿では,統一EconRLパイプラインに統合可能な2つの補完手法を提案する。
論文参考訳（メタデータ） (2025-09-16T03:00:13Z)
VFOG: Variance-Reduced Fast Optimistic Gradient Methods for a Class of Nonmonotone Generalized Equations [3.6997773420183866]
我々は,Nesterovの加速度と分散還元技術を組み合わせた,新しい楽観的勾配型アルゴリズムフレームワークを開発した。この手法はリプシッツ連続性の下で残余の平方ノルムを期待して$mathcalO (1/k2)$収束率を達成することを示す。提案手法の反復列は根本問題の解にほぼ確実に収束することを示す。
論文参考訳（メタデータ） (2025-08-22T20:46:29Z)
A kernel conditional two-sample test [5.503626337185689]
学習手法の信頼性境界を条件付き2サンプルテストに変換する。アクセス不能なパラメータのチューニングを避けるためにブートストラップ方式を導入する。その結果,条件付き2サンプルテストの総合的な基盤が確立された。
論文参考訳（メタデータ） (2025-06-04T12:53:13Z)
Conditional Testing based on Localized Conformal p-values [5.6779147365057305]
我々は、予測区間を反転させて局所化された共形p値を定義し、それらの理論的性質を証明した。これらの定義されたp-値は、その実用性を説明するためにいくつかの条件付きテスト問題に適用される。
論文参考訳（メタデータ） (2024-09-25T11:30:14Z)
Federated Nonparametric Hypothesis Testing with Differential Privacy Constraints: Optimal Rates and Adaptive Tests [5.3595271893779906]
フェデレート学習は、さまざまな場所でデータが収集され分析される広範囲な設定で適用可能であることから、近年大きな注目を集めている。分散差分プライバシー(DP)制約下でのホワイトノイズ・ウィズ・ドリフトモデルにおける非パラメトリック適合性試験について検討した。
論文参考訳（メタデータ） (2024-06-10T19:25:19Z)
Robust Kernel Hypothesis Testing under Data Corruption [6.430258446597413]
データ破損下での頑健な置換テストを構築するための2つの一般的な方法を提案する。最小限の条件下での力の一貫性を証明する。これは、潜在的な敵攻撃を伴う現実世界のアプリケーションに対する仮説テストの実践的な展開に寄与する。
論文参考訳（メタデータ） (2024-05-30T10:23:16Z)
Uncertainty-Calibrated Test-Time Model Adaptation without Forgetting [55.17761802332469]
テスト時間適応(TTA)は、与えられたモデルw.r.t.を任意のテストサンプルに適用することにより、トレーニングデータとテストデータの間の潜在的な分散シフトに取り組むことを目指している。事前の手法は各テストサンプルに対してバックプロパゲーションを実行するため、多くのアプリケーションに対して許容できない最適化コストがかかる。本稿では, 有効サンプル選択基準を策定し, 信頼性および非冗長なサンプルを同定する, 効率的なアンチフォッティングテスト時間適応法を提案する。
論文参考訳（メタデータ） (2024-03-18T05:49:45Z)
An Efficient Rehearsal Scheme for Catastrophic Forgetting Mitigation during Multi-stage Fine-tuning [55.467047686093025]
このような忘れを緩和するための一般的なアプローチは、微調整中に以前のタスクからサンプルをリハーサルすることである。側方損傷のリハーサルを優先するサンプリング手法である textttbf mix-cd を提案する。我々の手法は計算効率が高く、実装が容易で、計算制約のある設定においていくつかの主要な連続学習手法より優れています。
論文参考訳（メタデータ） (2024-02-12T22:32:12Z)
Deep anytime-valid hypothesis testing [29.273915933729057]
非パラメトリックなテスト問題に対する強力なシーケンシャルな仮説テストを構築するための一般的なフレームワークを提案する。テスト・バイ・ベッティング・フレームワーク内で、機械学習モデルの表現能力を活用するための原則的なアプローチを開発する。合成および実世界のデータセットに関する実証的な結果は、我々の一般的なフレームワークを用いてインスタンス化されたテストが、特殊なベースラインと競合することを示している。
論文参考訳（メタデータ） (2023-10-30T09:46:19Z)
Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文参考訳（メタデータ） (2022-12-14T18:08:42Z)
Asymptotically Unbiased Instance-wise Regularized Partial AUC Optimization: Theory and Algorithm [101.44676036551537]
One-way partial AUC (OPAUC) と Two-way partial AUC (TPAUC) はバイナリ分類器の平均性能を測定する。既存の手法のほとんどはPAUCをほぼ最適化するしかなく、制御不能なバイアスにつながる。本稿では,分散ロバスト最適化AUCによるPAUC問題の簡易化について述べる。
論文参考訳（メタデータ） (2022-10-08T08:26:22Z)
Robust Continual Test-time Adaptation: Instance-aware BN and Prediction-balanced Memory [58.72445309519892]
テストデータストリーム以外のデータストリームに対して堅牢な新しいテスト時間適応方式を提案する。 a)分布外サンプルの正規化を修正するIABN(Instance-Aware Batch Normalization)と、(b)クラスバランスのない方法で非i.d.ストリームからのデータストリームをシミュレートするPBRS(Predict- Balanced Reservoir Sampling)である。
論文参考訳（メタデータ） (2022-08-10T03:05:46Z)
Efficient Aggregated Kernel Tests using Incomplete $U$-statistics [22.251118308736327]
提案した3つのテストは、複数のカーネル帯域に集約され、さまざまなスケールでnullからの離脱を検出する。提案した線形時間集約テストは,現在最先端の線形時間カーネルテストよりも高い出力が得られることを示す。
論文参考訳（メタデータ） (2022-06-18T12:30:06Z)
Sequential Permutation Testing of Random Forest Variable Importance Measures [68.8204255655161]
そこで本研究では、逐次置換テストと逐次p値推定を用いて、従来の置換テストに関連する高い計算コストを削減することを提案する。シミュレーション研究の結果、シーケンシャルテストの理論的性質が当てはまることを確認した。本手法の数値安定性を2つの応用研究で検討した。
論文参考訳（メタデータ） (2022-06-02T20:16:50Z)
AdaPT-GMM: Powerful and robust covariate-assisted multiple testing [0.7614628596146599]
偽発見率(FDR)制御を用いた複数検定の実証的ベイズ法を提案する。本手法は,アダプティブp値しきい値法(AdaPT)をマスク方式の一般化により洗練する。我々は、AdaPT-GMMと呼ばれる新しい手法が一貫して高出力を実現することを、広範囲にわたるシミュレーションと実データ例で示す。
論文参考訳（メタデータ） (2021-06-30T05:06:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。