論文の概要: The minimax risk in testing the histogram of discrete distributions for
uniformity under missing ball alternatives
- arxiv url: http://arxiv.org/abs/2305.18111v4
- Date: Mon, 2 Oct 2023 01:07:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-10-03 17:36:23.498371
- Title: The minimax risk in testing the histogram of discrete distributions for
uniformity under missing ball alternatives
- Title(参考訳): ボールオルタナティブが欠如する一様性に対する離散分布ヒストグラムの試験におけるミニマックスリスク
- Authors: Alon Kipnis
- Abstract要約: 本研究は,各カテゴリの項目の適合度を,各カテゴリにおける一様分布と比較するものである。
サンプル数$n$とカテゴリ数$N$が無限に、$epsilon$がゼロになれば、ミニマックスリスク$R_epsilon*$はサンプルのヒストグラムに基づいてテストされる。
我々のテストは、衝突のみを使用するチフタッドテストやテストよりもはるかに優れていることを示す。
- 参考スコア(独自算出の注目度): 8.285441115330944
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of testing the fit of a sample of items from many
categories to the uniform distribution over the categories. As a class of
alternative hypotheses, we consider the removal of an $\ell_p$ ball of radius
$\epsilon$ around the uniform rate sequence for $p \leq 2$. When the number of
samples $n$ and number of categories $N$ go to infinity while $\epsilon$ goes
to zero, the minimax risk $R_\epsilon^*$ in testing based on the sample's
histogram (number of absent categories, singletons, collisions, ...) asymptotes
to $2\Phi(-n N^{2-2/p} \epsilon^2/\sqrt{8N})$, with $\Phi(x)$ the normal CDF.
This characterization allows comparing the many estimators previously proposed
for this problem at the constant level rather than the rate of convergence of
their risks. The minimax test mostly relies on collisions when $n/N$ is small,
but otherwise behaves like the chisquared test. Empirical studies over a range
of problem parameters show that this estimate is accurate in finite samples and
that our test is significantly better than the chisquared test or a test that
only uses collisions. Our analysis relies on the asymptotic normality of
histogram ordinates, the equivalence between the minimax setting and a Bayesian
setting, and the characterization of the least favorable prior by reducing a
multi-dimensional optimization problem to a one-dimensional problem.
- Abstract(参考訳): 我々は,多くのカテゴリからカテゴリ上の一様分布に対する項目のサンプルの適合性をテストする問題を考える。
代替仮説のクラスとして、半径$\epsilon$ の $\ell_p$ の球を、$p \leq 2$ の均一レート列の周りに取り除くことを考える。
n$ のサンプル数と $n$ のカテゴリ数が infinity のとき、$\epsilon$ が 0 のとき、minimax のリスク $r_\epsilon^*$ は標本のヒストグラム(欠落したカテゴリ、シングルトン、衝突数、...)に基づいて、通常の cdf に対して$\phi(x)$ で$2\phi(-n n^{2-2/p} \epsilon^2/\sqrt{8n})$ となる。
この特徴付けにより、以前に提案された多くの推定器を、リスクの収束率よりも一定のレベルで比較することができる。
minimax テストは、主に $n/n$ が小さい場合の衝突に依存するが、さもなければ chisquared テストのように振る舞う。
種々の問題パラメータに関する実証的な研究により、この推定は有限標本において正確であり、我々のテストは衝突のみを用いるチフタッドテストやテストよりもはるかに優れていることが示された。
本解析は,ヒストグラム順序の漸近的正規性,ミニマックス設定とベイズ設定の等価性,および多次元最適化問題を1次元問題に還元することにより,最善の優先条件のキャラクタリゼーションに依存する。
関連論文リスト
- The Polynomial Stein Discrepancy for Assessing Moment Convergence [1.0835264351334324]
本研究では,サンプルの集合とベイズ推定のための所望の後方分布との差を測定する新しい手法を提案する。
いくつかの例において、このテストは競合他社よりも高いパワーを持ち、計算コストが低いことを示す。
論文 参考訳(メタデータ) (2024-12-06T15:51:04Z) - Wasserstein F-tests for Fréchet regression on Bures-Wasserstein manifolds [0.9514940899499753]
ビュール・ワッサーシュタイン多様体上のフレシェレグレッションが発展する。
非関連性の零仮説のテストが提案されている。
結果は,提案した試験が所望の有意な程度に有意であることを示している。
論文 参考訳(メタデータ) (2024-04-05T04:01:51Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Optimal minimax rate of learning interaction kernels [7.329333373512536]
広帯域の交換可能な分布に対して最適な収束率を得るための最小二乗推定器(tLSE)を導入する。
以上の結果から, 大きな試料限界の逆問題が保たれた場合, 左テール確率はバイアス分散トレードオフを変化させないことがわかった。
論文 参考訳(メタデータ) (2023-11-28T15:01:58Z) - Precise Error Rates for Computationally Efficient Testing [67.30044609837749]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - On High dimensional Poisson models with measurement error: hypothesis
testing for nonlinear nonconvex optimization [13.369004892264146]
我々は高次元の回帰モデルの推定と検証を行い、データ解析に広く応用する。
ペナル化された一貫性を最小化することで回帰パラメータを推定する。
提案手法はアルツハイマー病イニシアチブに適用される。
論文 参考訳(メタデータ) (2022-12-31T06:58:42Z) - Sharp Constants in Uniformity Testing via the Huber Statistic [16.384142529375435]
一様性テスト(英: Uniformity testing)は、プロパティテストにおいて最もよく研究されている問題の1つである。
1-デルタ確率を持つ任意の$epsilon$-far分布と$m$要素上の均一分布を区別する最適なサンプル複雑性は$nであることが知られている。
衝突試験機は, 均一入力と非一様入力の分離の標準偏差数において, 急激な最大定数を達成することを示す。
論文 参考訳(メタデータ) (2022-06-21T20:43:53Z) - Polyak-Ruppert Averaged Q-Leaning is Statistically Efficient [90.14768299744792]
我々はPolyak-Ruppert 平均 Q-leaning (平均 Q-leaning) を用いた同期 Q-learning を$gamma$-discounted MDP で検討した。
繰り返し平均$barboldsymbolQ_T$に対して正規性を確立する。
要するに、我々の理論分析は、Q-Leaningの平均は統計的に効率的であることを示している。
論文 参考訳(メタデータ) (2021-12-29T14:47:56Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - The Sample Complexity of Robust Covariance Testing [56.98280399449707]
i. i. d.
形式 $Z = (1-epsilon) X + epsilon B$ の分布からのサンプル。ここで $X$ はゼロ平均で未知の共分散である Gaussian $mathcalN(0, Sigma)$ である。
汚染がない場合、事前の研究は、$O(d)$サンプルを使用するこの仮説テストタスクの単純なテスターを与えた。
サンプル複雑性の上限が $omega(d2)$ for $epsilon$ an arbitrarily small constant and $gamma であることを証明します。
論文 参考訳(メタデータ) (2020-12-31T18:24:41Z) - Optimal Testing of Discrete Distributions with High Probability [49.19942805582874]
高確率状態に着目して離散分布を試験する問題について検討する。
一定の要素でサンプル最適である近接性および独立性テストのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-14T16:09:17Z) - Minimax Estimation of Conditional Moment Models [40.95498063465325]
min-max基準関数を導入し,ゼロサムゲームの解法とみなすことができる。
任意の仮説空間に対する結果推定器の統計的推定速度を解析する。
修正された平均二乗誤差率と、逆問題の不備とが組み合わさって、平均二乗誤差率をもたらすことを示す。
論文 参考訳(メタデータ) (2020-06-12T14:02:38Z) - Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and
Variance Reduction [63.41789556777387]
非同期Q-ラーニングはマルコフ決定過程(MDP)の最適行動値関数(またはQ-関数)を学習することを目的としている。
Q-関数の入出力$varepsilon$-正確な推定に必要なサンプルの数は、少なくとも$frac1mu_min (1-gamma)5varepsilon2+ fract_mixmu_min (1-gamma)$の順である。
論文 参考訳(メタデータ) (2020-06-04T17:51:00Z) - Breaking the Sample Size Barrier in Model-Based Reinforcement Learning
with a Generative Model [50.38446482252857]
本稿では、生成モデル(シミュレータ)へのアクセスを想定して、強化学習のサンプル効率について検討する。
最初に$gamma$-discounted infinite-horizon Markov decision process (MDPs) with state space $mathcalS$ and action space $mathcalA$を考える。
対象の精度を考慮すれば,モデルに基づく計画アルゴリズムが最小限のサンプルの複雑さを実現するのに十分であることを示す。
論文 参考訳(メタデータ) (2020-05-26T17:53:18Z) - Computationally efficient sparse clustering [67.95910835079825]
我々はPCAに基づく新しいクラスタリングアルゴリズムの有限サンプル解析を行う。
ここでは,ミニマックス最適誤クラスタ化率を,体制$|theta infty$で達成することを示す。
論文 参考訳(メタデータ) (2020-05-21T17:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。