論文の概要: Consistent model selection in the spiked Wigner model via AIC-type
criteria
- arxiv url: http://arxiv.org/abs/2307.12982v1
- Date: Mon, 24 Jul 2023 17:59:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-25 13:14:18.458171
- Title: Consistent model selection in the spiked Wigner model via AIC-type
criteria
- Title(参考訳): AIC型基準によるスパイクウィグナーモデルの一貫性モデル選択
- Authors: Soumendu Sundar Mukherjee
- Abstract要約: 我々は[-2, (textmaximized log-likelihood) + gamma, (text number of parameters)]という形のAIC型モデル選択基準を検討し, スパイク数$k$を推定する。
AICは強い一貫性はないが、$gamma = 2 + delta_N$と$delta_N gg N-2/3$とすると、$kの弱い一貫した推定値が得られる。
- 参考スコア(独自算出の注目度): 3.04585143845864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consider the spiked Wigner model \[ X = \sum_{i = 1}^k \lambda_i u_i u_i^\top
+ \sigma G, \] where $G$ is an $N \times N$ GOE random matrix, and the
eigenvalues $\lambda_i$ are all spiked, i.e. above the Baik-Ben Arous-P\'ech\'e
(BBP) threshold $\sigma$. We consider AIC-type model selection criteria of the
form \[ -2 \, (\text{maximised log-likelihood}) + \gamma \, (\text{number of
parameters}) \] for estimating the number $k$ of spikes. For $\gamma > 2$, the
above criterion is strongly consistent provided $\lambda_k > \lambda_{\gamma}$,
where $\lambda_{\gamma}$ is a threshold strictly above the BBP threshold,
whereas for $\gamma < 2$, it almost surely overestimates $k$. Although AIC
(which corresponds to $\gamma = 2$) is not strongly consistent, we show that
taking $\gamma = 2 + \delta_N$, where $\delta_N \to 0$ and $\delta_N \gg
N^{-2/3}$, results in a weakly consistent estimator of $k$. We also show that a
certain soft minimiser of AIC is strongly consistent.
- Abstract(参考訳): スパイクウィグナーモデル \[x = \sum_{i = 1}^k \lambda_i u_i u_i^\top + \sigma g, \] ここで$g$ は$n \times n$ goe ランダム行列であり、固有値 $\lambda_i$ はすべてスパイクであり、つまり baik-ben arous-p\'ech\'e (bbp) しきい値 $\sigma$ である。
スパイク数$k$を推定するために、AIC型のモデル選択基準として \[[ -2 \, (\text{maximised log-likelihood}) + \gamma \, (\text{number of parameters}) \] を考える。
$\lambda_k > \lambda_{\gamma}$ の場合、$\lambda_{\gamma}$ は BBP しきい値より厳密に高いしきい値であるが、$\gamma < 2$ の場合、ほぼ確実に$k$ を過大評価する。
AIC ($\gamma = 2$) は強い整合性はないが、$\gamma = 2 + \delta_N$ を取ると、$\delta_N \to 0$ と $\delta_N \gg N^{-2/3}$ とすると、$k$ の弱一貫した推定値が得られる。
また、AICのソフトなミニミザーが強い一貫性を持つことを示す。
関連論文リスト
- Conditional regression for the Nonlinear Single-Variable Model [4.565636963872865]
F(X):=f(Pi_gamma):mathbbRdto[0,rmlen_gamma]$ ここで$Pi_gamma: [0,rmlen_gamma]tomathbbRd$と$f:[0,rmlen_gamma]tomathbbR1$を考える。
条件回帰に基づく非パラメトリック推定器を提案し、$one$-dimensionalOptimical min-maxレートを実現できることを示す。
論文 参考訳(メタデータ) (2024-11-14T18:53:51Z) - A computational transition for detecting correlated stochastic block models by low-degree polynomials [13.396246336911842]
一対のランダムグラフにおける相関性の検出は、近年広く研究されている基本的な統計的および計算上の問題である。
一対の相関ブロックモデル $mathcalS(n,tfraclambdan;k,epsilon;s)$ を共通の親ブロックモデル $mathcalS(n,tfraclambdan;k,epsilon;s)$ からサブサンプリングする。
隣接部のエントリーのエンスロー度に基づくテストに焦点をあてる
論文 参考訳(メタデータ) (2024-09-02T06:14:05Z) - Improved Bound for Robust Causal Bandits with Linear Models [16.60875994745622]
本稿では,時間的モデル変動に直面した因果包帯のロバスト性について検討する。
提案アルゴリズムは,$C$が$o(sqrtT)$の場合に,ほぼ最適な$tildemathcalO(sqrtT)$後悔を達成する。
論文 参考訳(メタデータ) (2024-05-13T14:41:28Z) - Reward-Mixing MDPs with a Few Latent Contexts are Learnable [75.17357040707347]
報酬混合マルコフ決定過程(RMMDP)におけるエピソード強化学習の検討
我々のゴールは、そのようなモデルにおける時間段階の累積報酬をほぼ最大化する、ほぼ最適に近いポリシーを学ぶことである。
論文 参考訳(メタデータ) (2022-10-05T22:52:00Z) - Best Policy Identification in Linear MDPs [70.57916977441262]
縮退した線形マルコフ+デルタ決定における最適同定問題について, 生成モデルに基づく固定信頼度設定における検討を行った。
複雑な非最適化プログラムの解としての下位境界は、そのようなアルゴリズムを考案する出発点として用いられる。
論文 参考訳(メタデータ) (2022-08-11T04:12:50Z) - Mean Estimation in High-Dimensional Binary Markov Gaussian Mixture
Models [12.746888269949407]
2進隠れマルコフモデルに対する高次元平均推定問題を考える。
ほぼ最小限の誤差率(対数係数まで)を $|theta_*|,delta,d,n$ の関数として確立する。
論文 参考訳(メタデータ) (2022-06-06T09:34:04Z) - Polyak-Ruppert Averaged Q-Leaning is Statistically Efficient [90.14768299744792]
我々はPolyak-Ruppert 平均 Q-leaning (平均 Q-leaning) を用いた同期 Q-learning を$gamma$-discounted MDP で検討した。
繰り返し平均$barboldsymbolQ_T$に対して正規性を確立する。
要するに、我々の理論分析は、Q-Leaningの平均は統計的に効率的であることを示している。
論文 参考訳(メタデータ) (2021-12-29T14:47:56Z) - Improved Sample Complexity for Incremental Autonomous Exploration in
MDPs [132.88757893161699]
我々は $epsilon$-optimal 目標条件付きポリシーのセットを学び、$ L$ ステップ内で段階的に到達可能なすべての状態を達成します。
DisCoは、コストに敏感な最短経路問題に対して$epsilon/c_min$-optimalポリシーを返すことができる最初のアルゴリズムです。
論文 参考訳(メタデータ) (2020-12-29T14:06:09Z) - $\lambda$-Regularized A-Optimal Design and its Approximation by
$\lambda$-Regularized Proportional Volume Sampling [1.256413718364189]
本稿では,$lambda$-regularized $A$-optimal design problemについて検討し,$lambda$-regularized proportional volume sample algorithmを紹介する。
この問題は、リッジ回帰モデルにおける真の係数からリッジ回帰予測器の2乗誤差を最小化しようとする、リッジ回帰の最適設計から動機づけられている。
論文 参考訳(メタデータ) (2020-06-19T15:17:57Z) - Model-Free Reinforcement Learning: from Clipped Pseudo-Regret to Sample
Complexity [59.34067736545355]
S$状態、$A$アクション、割引係数$gamma in (0,1)$、近似しきい値$epsilon > 0$の MDP が与えられた場合、$epsilon$-Optimal Policy を学ぶためのモデルなしアルゴリズムを提供する。
十分小さな$epsilon$の場合、サンプルの複雑さで改良されたアルゴリズムを示す。
論文 参考訳(メタデータ) (2020-06-06T13:34:41Z) - Curse of Dimensionality on Randomized Smoothing for Certifiable
Robustness [151.67113334248464]
我々は、他の攻撃モデルに対してスムースな手法を拡張することは困難であることを示す。
我々はCIFARに関する実験結果を示し,その理論を検証した。
論文 参考訳(メタデータ) (2020-02-08T22:02:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。