論文の概要: On the design-dependent suboptimality of the Lasso
- arxiv url: http://arxiv.org/abs/2402.00382v1
- Date: Thu, 1 Feb 2024 07:01:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-02 16:13:40.609376
- Title: On the design-dependent suboptimality of the Lasso
- Title(参考訳): ラッソの設計依存部分最適性について
- Authors: Reese Pathak, Cong Ma
- Abstract要約: 最小特異値が小さい場合、ラッソ推定器は、確実に最小値であることを示す。
我々の下限は、ラッソの全ての形態のまばらな統計的最適性を妨げるのに十分強い。
- 参考スコア(独自算出の注目度): 27.970033039287884
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: This paper investigates the effect of the design matrix on the ability (or
inability) to estimate a sparse parameter in linear regression. More
specifically, we characterize the optimal rate of estimation when the smallest
singular value of the design matrix is bounded away from zero. In addition to
this information-theoretic result, we provide and analyze a procedure which is
simultaneously statistically optimal and computationally efficient, based on
soft thresholding the ordinary least squares estimator. Most surprisingly, we
show that the Lasso estimator -- despite its widespread adoption for sparse
linear regression -- is provably minimax rate-suboptimal when the minimum
singular value is small. We present a family of design matrices and sparse
parameters for which we can guarantee that the Lasso with any choice of
regularization parameter -- including those which are data-dependent and
randomized -- would fail in the sense that its estimation rate is suboptimal by
polynomial factors in the sample size. Our lower bound is strong enough to
preclude the statistical optimality of all forms of the Lasso, including its
highly popular penalized, norm-constrained, and cross-validated variants.
- Abstract(参考訳): 本稿では,設計行列が線形回帰におけるスパースパラメータを推定する能力(あるいは不容易性)に与える影響について検討する。
より具体的には、設計行列の最小特異値がゼロから離れたときの最適推定率を特徴づける。
この情報理論的な結果に加えて, 平均最小二乗推定器のソフトしきい値に基づいて, 統計的に最適かつ計算効率の良い手順を提示し, 解析する。
最も驚くべきことに、ラッソ推定器は -- スパース線形回帰(sparse linear regression)に広く採用されているにもかかわらず -- 最小特異値が小さい場合の最小レート-最適である。
我々は,データ依存かつランダム化されたパラメータを含む任意の正規化パラメータの選択を持つlassoが,その推定率がサンプルサイズの多項式係数によって最適でないという意味で失敗することを保証できる,設計行列とスパースパラメータの族を提案する。
我々の下限はラッソのあらゆる形態の統計的最適性を妨げるのに十分な強度であり、その高い人気を持つペナルティ化、規範制約付き、およびクロスバリアードを含む。
関連論文リスト
- Bayesian Nonparametrics Meets Data-Driven Distributionally Robust Optimization [29.24821214671497]
機械学習と統計モデルのトレーニングは、しばしばデータ駆動型リスク基準の最適化を伴う。
ベイズ的非パラメトリック(ディリクレ過程)理論と、スムーズなあいまいさ-逆選好の最近の決定論的モデルを組み合わせた、新しいロバストな基準を提案する。
実用的な実装として、よく知られたディリクレプロセスの表現に基づいて、評価基準の抽出可能な近似を提案し、研究する。
論文 参考訳(メタデータ) (2024-01-28T21:19:15Z) - Error Reduction from Stacked Regressions [12.657895453939298]
積み重ね回帰は、予測精度を高めるために異なる回帰推定器の線形結合を形成するアンサンブル手法である。
本稿では,非負性制約を受ける経験的リスクの正規化バージョンを最小化することにより,これらの重みを類似的に学習する。
適応的縮小効果により、結果として生じる累積推定量は、最も優れた単一推定値よりも人口リスクが厳しく小さい。
論文 参考訳(メタデータ) (2023-09-18T15:42:12Z) - Quantized Low-Rank Multivariate Regression with Random Dithering [23.81618208119832]
低ランク多変量回帰(LRMR)は重要な統計的学習モデルである。
基礎となる係数行列の推定に焦点をあてる。
我々は、ランダムディザリングを伴う均一な量子化、すなわち、量子化の前に適切なランダムノイズをデータに追加する。
制約付きラッソおよび正規化ラッソ推定器を提案し、非漸近誤差境界を導出する。
論文 参考訳(メタデータ) (2023-02-22T08:14:24Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Understanding Implicit Regularization in Over-Parameterized Single Index
Model [55.41685740015095]
我々は高次元単一インデックスモデルのための正規化自由アルゴリズムを設計する。
暗黙正則化現象の理論的保証を提供する。
論文 参考訳(メタデータ) (2020-07-16T13:27:47Z) - Fundamental Limits of Ridge-Regularized Empirical Risk Minimization in
High Dimensions [41.7567932118769]
経験的リスク最小化アルゴリズムは、様々な推定や予測タスクで広く利用されている。
本稿では,コンベックスEMMの統計的精度に関する基礎的限界を推論のために初めて特徴づける。
論文 参考訳(メタデータ) (2020-06-16T04:27:38Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - SUMO: Unbiased Estimation of Log Marginal Probability for Latent
Variable Models [80.22609163316459]
無限級数のランダム化トランケーションに基づく潜在変数モデルに対して、ログ境界確率の非バイアス推定器とその勾配を導入する。
推定器を用いてトレーニングしたモデルは、同じ平均計算コストに対して、標準的な重要度サンプリングに基づくアプローチよりも優れたテストセット確率を与えることを示す。
論文 参考訳(メタデータ) (2020-04-01T11:49:30Z) - Support recovery and sup-norm convergence rates for sparse pivotal
estimation [79.13844065776928]
高次元スパース回帰では、ピボット推定器は最適な正規化パラメータがノイズレベルに依存しない推定器である。
非滑らかで滑らかな単一タスクとマルチタスク正方形ラッソ型推定器に対するミニマックス超ノルム収束率を示す。
論文 参考訳(メタデータ) (2020-01-15T16:11:04Z) - On Low-rank Trace Regression under General Sampling Distribution [9.699586426043885]
クロスバリデード推定器は一般仮定でほぼ最適誤差境界を満たすことを示す。
また, クロスバリデーション推定器はパラメータ選択理論に着想を得た手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2019-04-18T02:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。