論文の概要: Optimistic Interior Point Methods for Sequential Hypothesis Testing by Betting
- arxiv url: http://arxiv.org/abs/2502.07774v1
- Date: Tue, 11 Feb 2025 18:57:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:06:49.215211
- Title: Optimistic Interior Point Methods for Sequential Hypothesis Testing by Betting
- Title(参考訳): ベッティングによる逐次仮説検証のための最適内部点法
- Authors: Can Chen, Jun-Kun Wang,
- Abstract要約: 本稿では, 内部点法を最適化に活用して, 勾配爆発のリスクを伴わずに, 決定空間全体の更新を可能にする新しい戦略を提案する。
我々の手法は強い統計的保証を維持するだけでなく、臨界シナリオにおける高速なヌル仮説の拒絶を促進する。
- 参考スコア(独自算出の注目度): 14.70496845511859
- License:
- Abstract: The technique of "testing by betting" frames nonparametric sequential hypothesis testing as a multiple-round game, where a player bets on future observations that arrive in a streaming fashion, accumulates wealth that quantifies evidence against the null hypothesis, and rejects the null once the wealth exceeds a specified threshold while controlling the false positive error. Designing an online learning algorithm that achieves a small regret in the game can help rapidly accumulate the bettor's wealth, which in turn can shorten the time to reject the null hypothesis under the alternative $H_1$. However, many of the existing works employ the Online Newton Step (ONS) to update within a halved decision space to avoid a gradient explosion issue, which is potentially conservative for rapid wealth accumulation. In this paper, we introduce a novel strategy utilizing interior-point methods in optimization that allows updates across the entire interior of the decision space without the risk of gradient explosion. Our approach not only maintains strong statistical guarantees but also facilitates faster null hypothesis rejection in critical scenarios, overcoming the limitations of existing approaches.
- Abstract(参考訳): 賭けによる検証」のテクニックは、非パラメトリックシーケンシャル仮説テストをマルチラウンドゲームとしてフレーム化し、プレイヤーはストリーミング方式でやってくる将来の観測に賭け、ヌル仮説に対する証拠を定量化する富を蓄積し、その富が所定の閾値を超えるとヌルを拒否する。
オンライン学習アルゴリズムを設計することで、ゲーム内で小さな後悔を味わうことができ、ベクターの富を急速に蓄積し、代わりに$H_1$でnull仮説を否定する時間を短縮することができる。
しかし、既存の作品の多くは、急激な富蓄積のために保守的な勾配爆発問題を避けるため、半減した決定空間内で更新するためにOnline Newton Step(ONS)を使用している。
本稿では,内部点法を最適化に活用して,勾配爆発のリスクを伴わずに決定空間全体を横断的に更新する手法を提案する。
我々のアプローチは、強い統計的保証を維持するだけでなく、臨界シナリオにおける高速なヌル仮説の拒絶を促進し、既存のアプローチの限界を克服する。
関連論文リスト
- Early Stopping in Contextual Bandits and Inferences [0.5439020425819]
過剰なサンプリングはコストがかかり、早期停止法と信頼性のある実験後の推論の破壊を動機付ける。
本稿では, サンプリングコストを考慮しつつ, 実験中の後悔を最小限に抑えるために, 事前決定およびオンライン停止ルールを含む, 線形文脈帯域の早期停止法について検討する。
論文 参考訳(メタデータ) (2025-02-05T00:40:10Z) - Achieving $\widetilde{\mathcal{O}}(\sqrt{T})$ Regret in Average-Reward POMDPs with Known Observation Models [56.92178753201331]
平均逆無限水平POMDPを未知の遷移モデルで扱う。
この障壁を克服する斬新でシンプルな推定器を提示する。
論文 参考訳(メタデータ) (2025-01-30T22:29:41Z) - Sequential Manipulation Against Rank Aggregation: Theory and Algorithm [119.57122943187086]
脆弱なデータ収集プロセスに対するオンライン攻撃を活用します。
ゲーム理論の観点からは、対決シナリオは分布的に堅牢なゲームとして定式化される。
提案手法は,ランクアグリゲーション手法の結果を逐次的に操作する。
論文 参考訳(メタデータ) (2024-07-02T03:31:21Z) - Non-Convex Robust Hypothesis Testing using Sinkhorn Uncertainty Sets [18.46110328123008]
非破壊仮説テスト問題に対処する新しい枠組みを提案する。
目標は、最大数値リスクを最小限に抑える最適な検出器を探すことである。
論文 参考訳(メタデータ) (2024-03-21T20:29:43Z) - Bayesian Online Multiple Testing: A Resource Allocation Approach [21.23710184381363]
本研究では,各実験が仮説テストタスクに対応する連続的な実験を行うことの問題点を考察する。
目的は、ローカル・ファルス・ディスカバリー・レート(LFDR)で測定された全ての時点において、低いエラー率を維持しながら発見回数を最大化することである。
予算安全バッファを組み込んだ新しいポリシーを提案する。
論文 参考訳(メタデータ) (2024-02-18T02:11:54Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - Robust Imitation via Mirror Descent Inverse Reinforcement Learning [18.941048578572577]
本稿では,制約付き凸問題の反復解である報酬関数列を予測することを提案する。
提案したミラー降下更新規則は,ブレグマンの発散を最小化できることを示す。
我々のIRL法は, 既存手法よりも高い性能を示した。
論文 参考訳(メタデータ) (2022-10-20T12:25:21Z) - Kernel Robust Hypothesis Testing [20.78285964841612]
本稿では,カーネル方式を用いて不確実性集合をデータ駆動方式で構築する。
目標は、不確実性集合上の最悪のケース分布の下でうまく機能するテストを設計することである。
Neyman-Pearsonの設定では、誤検知の最悪のケース確率を最小限に抑え、誤警報の最悪のケース確率を制約する。
論文 参考訳(メタデータ) (2022-03-23T23:59:03Z) - Learning Probabilistic Ordinal Embeddings for Uncertainty-Aware
Regression [91.3373131262391]
不確かさが唯一の確実性である。
伝統的に、直接回帰定式化を考慮し、ある確率分布の族に出力空間を変更することによって不確実性をモデル化する。
現在のレグレッション技術における不確実性をモデル化する方法は、未解決の問題である。
論文 参考訳(メタデータ) (2021-03-25T06:56:09Z) - Excursion Search for Constrained Bayesian Optimization under a Limited
Budget of Failures [62.41541049302712]
本稿では,所定の予算の失敗の関数として探索において許容されるリスクの量を制御する制御理論に基づく新しい意思決定者を提案する。
本アルゴリズムは, 種々の最適化実験において, 故障予算をより効率的に利用し, 一般に, 最先端の手法よりも, 後悔度を低くする。
論文 参考訳(メタデータ) (2020-05-15T09:54:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。