論文の概要: Best-Subset Selection in Generalized Linear Models: A Fast and
Consistent Algorithm via Splicing Technique
- arxiv url: http://arxiv.org/abs/2308.00251v1
- Date: Tue, 1 Aug 2023 03:11:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 15:41:33.867923
- Title: Best-Subset Selection in Generalized Linear Models: A Fast and
Consistent Algorithm via Splicing Technique
- Title(参考訳): 一般化線形モデルのベストサブセット選択:スプライシング法による高速で一貫性のあるアルゴリズム
- Authors: Junxian Zhu, Jin Zhu, Borui Tang, Xuanyu Chen, Hongmei Lin, Xueqin
Wang
- Abstract要約: ベストサブセットセクションは、このタイプの問題の聖杯として広く見なされている。
軽度条件下での最適部分集合回復のためのアルゴリズムを提案し,提案した。
我々の実装は、一般的な変数選択ツールキットと比較して約4倍のスピードアップを実現している。
- 参考スコア(独自算出の注目度): 0.6338047104436422
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In high-dimensional generalized linear models, it is crucial to identify a
sparse model that adequately accounts for response variation. Although the best
subset section has been widely regarded as the Holy Grail of problems of this
type, achieving either computational efficiency or statistical guarantees is
challenging. In this article, we intend to surmount this obstacle by utilizing
a fast algorithm to select the best subset with high certainty. We proposed and
illustrated an algorithm for best subset recovery in regularity conditions.
Under mild conditions, the computational complexity of our algorithm scales
polynomially with sample size and dimension. In addition to demonstrating the
statistical properties of our method, extensive numerical experiments reveal
that it outperforms existing methods for variable selection and coefficient
estimation. The runtime analysis shows that our implementation achieves
approximately a fourfold speedup compared to popular variable selection
toolkits like glmnet and ncvreg.
- Abstract(参考訳): 高次元一般化線形モデルでは、応答変動を適切に考慮したスパースモデルを特定することが重要である。
最良の部分集合は、このタイプの問題の聖杯と見なされているが、計算効率または統計的保証を達成することは困難である。
本稿では,高速アルゴリズムを用いて高い精度で最適なサブセットを選択することにより,この障害を克服する。
正規性条件における最良部分集合回復アルゴリズムの提案と実演を行った。
軽度条件下では,本アルゴリズムの計算複雑性は,サンプルサイズと寸法で多項式的にスケールする。
提案手法の統計的特性を示すことに加えて,既存の変数選択法や係数推定法よりも優れた数値実験を行った。
実行時解析では,glmnetやncvregのような一般的な変数選択ツールキットと比較して,約4倍の高速化を実現している。
関連論文リスト
- Efficient Numerical Algorithm for Large-Scale Damped Natural Gradient
Descent [7.368877979221163]
本研究では,パラメータ数が利用可能なサンプル数を大幅に上回る大規模シナリオにおいて,減衰したフィッシャー行列を効率的に解くアルゴリズムを提案する。
アルゴリズムはColesky分解に基づいており、一般に適用可能である。ベンチマークの結果、既存の手法よりもかなり高速であることが示されている。
論文 参考訳(メタデータ) (2023-10-26T16:46:13Z) - An Efficient Algorithm for Clustered Multi-Task Compressive Sensing [60.70532293880842]
クラスタ化マルチタスク圧縮センシングは、複数の圧縮センシングタスクを解決する階層モデルである。
このモデルに対する既存の推論アルゴリズムは計算コストが高く、高次元ではうまくスケールしない。
本稿では,これらの共分散行列を明示的に計算する必要をなくし,モデル推論を大幅に高速化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-30T15:57:14Z) - A Consistent and Scalable Algorithm for Best Subset Selection in Single
Index Models [1.3236116985407258]
高次元モデルにおける最良の部分集合選択は、計算的に難解であることが知られている。
我々は,高次元SIMにおける最良部分選択のための,証明可能な最初の拡張性アルゴリズムを提案する。
アルゴリズムは部分集合選択の一貫性を保ち、高い確率でオラクル特性を持つ。
論文 参考訳(メタデータ) (2023-09-12T13:48:06Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - Fast Feature Selection with Fairness Constraints [49.142308856826396]
モデル構築における最適特徴の選択に関する基礎的問題について検討する。
この問題は、greedyアルゴリズムの変種を使用しても、大規模なデータセットで計算的に困難である。
適応クエリモデルは,最近提案された非モジュラー関数に対する直交整合探索のより高速なパラダイムに拡張する。
提案アルゴリズムは、適応型クエリモデルにおいて指数関数的に高速な並列実行を実現する。
論文 参考訳(メタデータ) (2022-02-28T12:26:47Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Semi-analytic approximate stability selection for correlated data in
generalized linear models [3.42658286826597]
そこで本研究では,繰り返しのフィッティングを行なわずに安定選択を行うことのできる,新しい近似推論アルゴリズムを提案する。
このアルゴリズムは,情報理論の統計力学とベクトル近似メッセージパッシングの複製法に基づく。
数値実験により, このアルゴリズムは, 合成データと実世界のデータの両方に対して, 高速収束と高い近似精度を示すことを示した。
論文 参考訳(メタデータ) (2020-03-19T10:43:12Z) - Optimal Randomized First-Order Methods for Least-Squares Problems [56.05635751529922]
このアルゴリズムのクラスは、最小二乗問題に対する最も高速な解法のうち、いくつかのランダム化手法を含んでいる。
我々は2つの古典的埋め込み、すなわちガウス射影とアダマール変換のサブサンプリングに焦点を当てる。
得られたアルゴリズムは条件数に依存しない最小二乗問題の解法として最も複雑である。
論文 参考訳(メタデータ) (2020-02-21T17:45:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。