論文の概要: Breaking hypothesis testing for failure rates
- arxiv url: http://arxiv.org/abs/2001.04045v1
- Date: Mon, 13 Jan 2020 03:17:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 23:52:02.346273
- Title: Breaking hypothesis testing for failure rates
- Title(参考訳): 失敗率の破壊仮説テスト
- Authors: Rohit Pandey, Yingnong Dang, Gil Lapid Shafriri, Murali Chintalapati,
Aerin Kim
- Abstract要約: 本稿では、ポイントプロセスと障害率の有用性と、ポアソンポイントプロセスである失敗率をモデル化するための最も一般的なプロセスについて述べる。
このテストの使用に対する一般的な議論は、実世界のデータはポアソン点過程にはほとんど従わないということである。
このようなテストの分布的な仮定が違反され、まだテストが適用されている場合に何が起こるかを調べる。
- 参考スコア(独自算出の注目度): 7.973062022996845
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We describe the utility of point processes and failure rates and the most
common point process for modeling failure rates, the Poisson point process.
Next, we describe the uniformly most powerful test for comparing the rates of
two Poisson point processes for a one-sided test (henceforth referred to as the
"rate test"). A common argument against using this test is that real world data
rarely follows the Poisson point process. We thus investigate what happens when
the distributional assumptions of tests like these are violated and the test
still applied. We find a non-pathological example (using the rate test on a
Compound Poisson distribution with Binomial compounding) where violating the
distributional assumptions of the rate test make it perform better (lower error
rates). We also find that if we replace the distribution of the test statistic
under the null hypothesis with any other arbitrary distribution, the
performance of the test (described in terms of the false negative rate to false
positive rate trade-off) remains exactly the same. Next, we compare the
performance of the rate test to a version of the Wald test customized to the
Negative Binomial point process and find it to perform very similarly while
being much more general and versatile. Finally, we discuss the applications to
Microsoft Azure. The code for all experiments performed is open source and
linked in the introduction.
- Abstract(参考訳): 本稿では、ポイントプロセスと障害率の有用性と、ポアソンポイントプロセスである失敗率をモデル化するための最も一般的なポイントプロセスについて述べる。
次に、2つのポアソン点過程の速度を片側テスト(以下「レートテスト」と呼ぶ)と比較するための一様に強力なテストについて述べる。
このテストの使用に対する一般的な議論は、実世界のデータはポアソン点過程にはほとんど従わないということである。
したがって,このようなテストの分布的仮定が破られ,テストが適用されると何が起こるかを検討する。
非病理学的な例(二項複合化を伴う複合ポアソン分布のレートテストを用いて)を見つけ、そこでは、レートテストの分布的仮定に違反することで、より良く(より低い誤差率)なる。
また、ヌル仮説の下で検定統計量の分布を他の任意の分布に置き換えるならば、検定のパフォーマンス(偽の負のレートから偽の正のレートのトレードオフまで)は全く同じである。
次に、負の2項点プロセスにカスタマイズされたwaldテストのバージョンとレートテストのパフォーマンスを比較して、より汎用的で汎用的でありながら、非常によく似た結果が得られることを見出します。
最後に、microsoft azureへのアプリケーションを議論する。
すべての実験のコードはオープンソースで、導入にリンクされている。
関連論文リスト
- Revisiting the Dataset Bias Problem from a Statistical Perspective [72.94990819287551]
統計的観点から「データセットバイアス」問題を考察する。
問題の主な原因は、クラス属性 u と非クラス属性 b の強い相関関係である。
本稿では,各試料nの目的をフラクタル1p(u_n|b_n)で重み付けするか,その試料をフラクタル1p(u_n|b_n)に比例してサンプリングすることにより,データセットバイアスを軽減することを提案する。
論文 参考訳(メタデータ) (2024-02-05T22:58:06Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Sequential Predictive Two-Sample and Independence Testing [114.4130718687858]
逐次的非パラメトリック2サンプルテストと独立テストの問題点について検討する。
私たちは賭けによる(非パラメトリックな)テストの原則に基づいています。
論文 参考訳(メタデータ) (2023-04-29T01:30:33Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Model-agnostic out-of-distribution detection using combined statistical
tests [15.27980070479021]
本稿では,学習された生成モデルを用いた分布外検出のための簡易な手法を提案する。
古典的パラメトリックテスト(ラオのスコアテスト)と最近導入された定性テストを組み合わせる。
その単純さと汎用性にもかかわらず、これらの手法はモデル固有のアウト・オブ・ディストリビューション検出アルゴリズムと競合することがある。
論文 参考訳(メタデータ) (2022-03-02T13:32:09Z) - Significance tests of feature relevance for a blackbox learner [6.72450543613463]
ブラックボックス学習者の特徴関連性に関する2つの一貫した試験を導出する。
第1は、推論サンプルの摂動による損失差を評価する。
2つ目は推論サンプルを2つに分割するが、データの摂動は必要ない。
論文 参考訳(メタデータ) (2021-03-02T00:59:19Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Testing Goodness of Fit of Conditional Density Models with Kernels [16.003516725803774]
条件分布に適合する2つの非パラメトリック統計テストを提案する。
私たちのテストは、任意の固定された代替条件モデルに対して一貫性があることを示します。
ニューヨーク市のタクシー降車場所の分布をモデル化する作業において,テストの解釈可能性を示す。
論文 参考訳(メタデータ) (2020-02-24T14:04:37Z) - The Chi-Square Test of Distance Correlation [7.748852202364896]
チ二乗検定は非パラメトリックであり、非常に高速であり、強い負のタイプ計量または特徴核を用いてバイアス補正された距離相関に適用できる。
基礎となるカイ二乗分布は上尾部の制限零分布をよく近似し支配しており、カイ二乗試験が独立性テストに有効で一貫性があることを証明している。
論文 参考訳(メタデータ) (2019-12-27T15:16:40Z) - Asymptotic Validity and Finite-Sample Properties of Approximate Randomization Tests [2.28438857884398]
我々の理論的な重要な貢献は、ノイズレスデータを用いた近似ランダム化テストのサイズと元のランダム化テストのサイズとの差に非漸近的境界を持つことである。
線形回帰における有意性のテストを含むいくつかの例を通して、我々の理論を解説する。
論文 参考訳(メタデータ) (2019-08-12T16:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。