論文の概要: Early Stopping Based on Repeated Significance
- arxiv url: http://arxiv.org/abs/2408.00908v1
- Date: Thu, 1 Aug 2024 20:58:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-05 14:56:17.992595
- Title: Early Stopping Based on Repeated Significance
- Title(参考訳): 繰り返し重要度に基づく早期停止
- Authors: Eric Bax, Arundhyoti Sarkar, Alex Shtoff,
- Abstract要約: 成功のための単一の基準を持つバケットテストでは、成功基準に対する$alpha$よりも小さい$p$-valueを要求すると、レベル1 - α$で統計的信頼が得られる。
複数の基準に対して、$alpha$を基準に分割するボネロニ補正は、各基準に対してより低い$p$-値を必要とするコストで統計的信頼を生み出す。
- 参考スコア(独自算出の注目度): 0.24578723416255754
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For a bucket test with a single criterion for success and a fixed number of samples or testing period, requiring a $p$-value less than a specified value of $\alpha$ for the success criterion produces statistical confidence at level $1 - \alpha$. For multiple criteria, a Bonferroni correction that partitions $\alpha$ among the criteria produces statistical confidence, at the cost of requiring lower $p$-values for each criterion. The same concept can be applied to decisions about early stopping, but that can lead to strict requirements for $p$-values. We show how to address that challenge by requiring criteria to be successful at multiple decision points.
- Abstract(参考訳): 成功のための単一の基準と一定の数のサンプルまたはテスト期間を持つバケットテストの場合、成功基準のための$\alpha$の特定の値よりも小さい$p$-valueを要求すると、レベル1 - \alpha$の統計的信頼が得られる。
複数の基準について、Bonferroniによる$\alpha$を分割する補正は、各基準に対してより低い$p$-値を必要とするコストで統計的信頼を生み出す。
同じ概念が早期停止に関する決定にも適用可能だが、これは$p$-valuesの厳格な要件につながる可能性がある。
私たちは、複数の意思決定ポイントで成功するための基準を必要とすることで、その課題にどのように対処するかを示します。
関連論文リスト
- Active Learning for Level Set Estimation Using Randomized Straddle Algorithms [18.96269063427081]
本稿では,関数が与えられたしきい値の上(または下)に値を取る入力点の集合を同定する新しい手法を提案する。
提案手法の信頼性パラメータは,反復数や候補点に依存しず,保守的でないという利点がある。
論文 参考訳(メタデータ) (2024-08-06T12:39:12Z) - A Conditional Independence Test in the Presence of Discretization [14.917729593550199]
既存のテストメソッドは、離散化された観察しかできない場合、機能しない。
このような離散化の存在に対応するために特別に設計された条件付き独立テストを提案する。
論文 参考訳(メタデータ) (2024-04-26T18:08:15Z) - Decomposing Hard SAT Instances with Metaheuristic Optimization [52.03315747221343]
分解硬度(d硬度)の概念を導入する。
d-硬度が$C$ w.r.tの硬度の推定値を示すことを示す。
論文 参考訳(メタデータ) (2023-12-16T12:44:36Z) - Minimax Instrumental Variable Regression and $L_2$ Convergence
Guarantees without Identification or Closedness [71.42652863687117]
インストゥルメンタル変数(IV)回帰の非パラメトリック推定について検討した。
固定IV解に収束できる新しいペナル化ミニマックス推定器を提案する。
ラックス条件下での推定値に対して強い$L$誤差率を導出する。
論文 参考訳(メタデータ) (2023-02-10T18:08:49Z) - Will My Robot Achieve My Goals? Predicting the Probability that an MDP Policy Reaches a User-Specified Behavior Target [56.99669411766284]
自律的なシステムがタスクを実行する場合、ユーザの目標を達成する確率のキャリブレーションされた見積もりを維持する必要がある。
本稿では,ユーザの目標が目標間隔として指定される設定について検討する。
我々は、共形予測を反転させて確率推定を計算する。
論文 参考訳(メタデータ) (2022-11-29T18:41:20Z) - The Projected Covariance Measure for assumption-lean variable significance testing [3.8936058127056357]
単純だが一般的なアプローチは、線形モデルを指定し、次に$X$の回帰係数が 0 でないかどうかをテストすることである。
条件付き平均独立性のモデルフリーなnullをテストする問題、すなわち条件付き平均の$Y$$$X$と$Z$は$X$に依存しない。
本稿では,加法モデルやランダムフォレストなど,柔軟な非パラメトリックあるいは機械学習手法を活用可能な,シンプルで汎用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-03T17:55:50Z) - Cost-aware Generalized $\alpha$-investing for Multiple Hypothesis
Testing [5.521213530218833]
非自明なデータ収集コストを伴う逐次多重仮説テストの問題点を考察する。
この問題は、病気の過程の異なる発現遺伝子を識別するための生物学的実験を行うときに発生する。
我々は,$alpha$-wealthの長期的挙動を理論的に分析し,$alpha$-investing決定規則のサンプルサイズを考慮した。
論文 参考訳(メタデータ) (2022-10-31T17:39:32Z) - Best Policy Identification in Linear MDPs [70.57916977441262]
縮退した線形マルコフ+デルタ決定における最適同定問題について, 生成モデルに基づく固定信頼度設定における検討を行った。
複雑な非最適化プログラムの解としての下位境界は、そのようなアルゴリズムを考案する出発点として用いられる。
論文 参考訳(メタデータ) (2022-08-11T04:12:50Z) - Hitting the Target: Stopping Active Learning at the Cost-Based Optimum [1.1756822700775666]
アクティブな学習は、従来の完全教師付き学習と同じようなパフォーマンスを維持しながら、ラベルの少ない機械学習モデルをトレーニングすることを可能にする。
本論文は,実世界のシナリオで使用する基準の停止について,実践者に対して実行可能なアドバイスを初めて行ったものである。
本研究は, 停止基準の大規模比較として, 精度・ラベルトレードオフの定量化のためのコスト尺度, 評価したすべての停止基準の公開実装, 停止基準の評価のためのオープンソースフレームワークを用いた。
論文 参考訳(メタデータ) (2021-10-07T21:33:34Z) - Statistical Query Lower Bounds for List-Decodable Linear Regression [55.06171096484622]
本稿では,リスト復号化可能な線形回帰問題について考察する。
我々の主な成果は、この問題に対して$dmathrmpoly (1/alpha)$の統計的クエリ(SQ)の低いバウンダリである。
論文 参考訳(メタデータ) (2021-06-17T17:45:21Z) - Sharp Statistical Guarantees for Adversarially Robust Gaussian
Classification [54.22421582955454]
逆向きに頑健な分類の過剰リスクに対する最適ミニマックス保証の最初の結果を提供する。
結果はAdvSNR(Adversarial Signal-to-Noise Ratio)の項で述べられており、これは標準的な線形分類と逆数設定との類似の考え方を一般化している。
論文 参考訳(メタデータ) (2020-06-29T21:06:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。