論文の概要: The Minimax Risk in Testing Uniformity of Poisson Data under Missing Ball Alternatives within a Hypercube
- arxiv url: http://arxiv.org/abs/2305.18111v6
- Date: Mon, 15 Jul 2024 19:30:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-18 00:20:24.605817
- Title: The Minimax Risk in Testing Uniformity of Poisson Data under Missing Ball Alternatives within a Hypercube
- Title(参考訳): ハイパーキューブ内のボール代替品におけるポアソンデータの均一性試験におけるミニマックスリスク
- Authors: Alon Kipnis,
- Abstract要約: 本研究は,様々なカテゴリーの項目が同一のポアソン分布に収まることの良さを検証することの課題について考察する。
代替仮説のクラスとして、超真空から半径$epsilon$の$ell_p$ ball, $p leq 2$の除去を考える。
期待されるサンプル数$n$とカテゴリ数$N$が無限に、$epsilon$が小さければ、ミニマックスの確率は2Phi(-n N2-2/p epsになる。
- 参考スコア(独自算出の注目度): 8.285441115330944
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of testing the goodness of fit of occurrences of items from many categories to an identical Poisson distribution over the categories. As a class of alternative hypotheses, we consider the removal of an $\ell_p$ ball, $p \leq 2$, of radius $\epsilon$ from a hypercube around the sequence of uniform Poisson rates. When the expected number of samples $n$ and number of categories $N$ go to infinity while $\epsilon$ is small, the minimax risk asymptotes to $2\Phi(-n N^{2-2/p} \epsilon^2/\sqrt{8N})$; $\Phi(x)$ is the normal CDF. This result allows the comparison of the many estimators previously proposed for this problem at the constant level, rather than at the rate of convergence of the risk or the scaling order of the sample complexity. The minimax test mostly relies on collisions in the small sample limit but behaves like the chisquared test. Empirical studies over a range of problem parameters show that the asymptotic risk estimate is accurate in finite samples and that the minimax test is significantly better than the chisquared test or a test that only uses collisions. Our analysis combines standard ideas from non-parametric hypothesis testing with new results in the low count limit of multiple Poisson distributions, including the convexity of certain kernels and a central limit theorem of linear test statistics.
- Abstract(参考訳): 本研究は,様々なカテゴリーの項目が同一のポアソン分布に収まることの良さを検証することの課題について考察する。
代替仮説のクラスとして、一様ポアソン数列のハイパーキューブから半径$\epsilon$の$\ell_p$ ball, $p \leq 2$の除去を考える。
期待されるサンプル数$n$とカテゴリ数$N$が無限大になり、$\epsilon$が小さければ、ミニマックスのアシャンポテスは$2\Phi(-n N^{2-2/p} \epsilon^2/\sqrt{8N})$; $\Phi(x)$は通常のCDFである。
この結果により、リスクの収束率やサンプルの複雑さのスケーリング順序よりも、この問題に対して以前に提案された多くの推定器を一定レベルで比較することができる。
ミニマックス試験は主に小さなサンプル限界での衝突に依存するが、チフタッド試験のように振る舞う。
様々な問題パラメータに関する実験的な研究により、漸近的リスク推定は有限標本において正確であり、ミニマックステストは衝突のみを用いるチフタッドテストやテストよりもはるかに優れていることが示された。
我々の分析は、非パラメトリック仮説テストの標準アイデアと、ある種のカーネルの凸性や線形テスト統計の中央極限定理を含む、複数のポアソン分布の最小値極限の新しい結果を組み合わせる。
関連論文リスト
- Wasserstein F-tests for Fréchet regression on Bures-Wasserstein manifolds [0.9514940899499753]
ビュール・ワッサーシュタイン多様体上のフレシェレグレッションが発展する。
非関連性の零仮説のテストが提案されている。
結果は,提案した試験が所望の有意な程度に有意であることを示している。
論文 参考訳(メタデータ) (2024-04-05T04:01:51Z) - Optimal minimax rate of learning interaction kernels [7.329333373512536]
広帯域の交換可能な分布に対して最適な収束率を得るための最小二乗推定器(tLSE)を導入する。
以上の結果から, 大きな試料限界の逆問題が保たれた場合, 左テール確率はバイアス分散トレードオフを変化させないことがわかった。
論文 参考訳(メタデータ) (2023-11-28T15:01:58Z) - Sharp Constants in Uniformity Testing via the Huber Statistic [16.384142529375435]
一様性テスト(英: Uniformity testing)は、プロパティテストにおいて最もよく研究されている問題の1つである。
1-デルタ確率を持つ任意の$epsilon$-far分布と$m$要素上の均一分布を区別する最適なサンプル複雑性は$nであることが知られている。
衝突試験機は, 均一入力と非一様入力の分離の標準偏差数において, 急激な最大定数を達成することを示す。
論文 参考訳(メタデータ) (2022-06-21T20:43:53Z) - Polyak-Ruppert Averaged Q-Leaning is Statistically Efficient [90.14768299744792]
我々はPolyak-Ruppert 平均 Q-leaning (平均 Q-leaning) を用いた同期 Q-learning を$gamma$-discounted MDP で検討した。
繰り返し平均$barboldsymbolQ_T$に対して正規性を確立する。
要するに、我々の理論分析は、Q-Leaningの平均は統計的に効率的であることを示している。
論文 参考訳(メタデータ) (2021-12-29T14:47:56Z) - The Sample Complexity of Robust Covariance Testing [56.98280399449707]
i. i. d.
形式 $Z = (1-epsilon) X + epsilon B$ の分布からのサンプル。ここで $X$ はゼロ平均で未知の共分散である Gaussian $mathcalN(0, Sigma)$ である。
汚染がない場合、事前の研究は、$O(d)$サンプルを使用するこの仮説テストタスクの単純なテスターを与えた。
サンプル複雑性の上限が $omega(d2)$ for $epsilon$ an arbitrarily small constant and $gamma であることを証明します。
論文 参考訳(メタデータ) (2020-12-31T18:24:41Z) - Optimal Testing of Discrete Distributions with High Probability [49.19942805582874]
高確率状態に着目して離散分布を試験する問題について検討する。
一定の要素でサンプル最適である近接性および独立性テストのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-14T16:09:17Z) - Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and
Variance Reduction [63.41789556777387]
非同期Q-ラーニングはマルコフ決定過程(MDP)の最適行動値関数(またはQ-関数)を学習することを目的としている。
Q-関数の入出力$varepsilon$-正確な推定に必要なサンプルの数は、少なくとも$frac1mu_min (1-gamma)5varepsilon2+ fract_mixmu_min (1-gamma)$の順である。
論文 参考訳(メタデータ) (2020-06-04T17:51:00Z) - Breaking the Sample Size Barrier in Model-Based Reinforcement Learning
with a Generative Model [50.38446482252857]
本稿では、生成モデル(シミュレータ)へのアクセスを想定して、強化学習のサンプル効率について検討する。
最初に$gamma$-discounted infinite-horizon Markov decision process (MDPs) with state space $mathcalS$ and action space $mathcalA$を考える。
対象の精度を考慮すれば,モデルに基づく計画アルゴリズムが最小限のサンプルの複雑さを実現するのに十分であることを示す。
論文 参考訳(メタデータ) (2020-05-26T17:53:18Z) - Computationally efficient sparse clustering [67.95910835079825]
我々はPCAに基づく新しいクラスタリングアルゴリズムの有限サンプル解析を行う。
ここでは,ミニマックス最適誤クラスタ化率を,体制$|theta infty$で達成することを示す。
論文 参考訳(メタデータ) (2020-05-21T17:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。