論文の概要: Semi-analytic approximate stability selection for correlated data in
generalized linear models
- arxiv url: http://arxiv.org/abs/2003.08670v2
- Date: Fri, 26 Jun 2020 03:10:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 04:16:24.744791
- Title: Semi-analytic approximate stability selection for correlated data in
generalized linear models
- Title(参考訳): 一般線形モデルにおける相関データの半解析近似安定性選択
- Authors: Takashi Takahashi, Yoshiyuki Kabashima
- Abstract要約: そこで本研究では,繰り返しのフィッティングを行なわずに安定選択を行うことのできる,新しい近似推論アルゴリズムを提案する。
このアルゴリズムは,情報理論の統計力学とベクトル近似メッセージパッシングの複製法に基づく。
数値実験により, このアルゴリズムは, 合成データと実世界のデータの両方に対して, 高速収束と高い近似精度を示すことを示した。
- 参考スコア(独自算出の注目度): 3.42658286826597
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the variable selection problem of generalized linear models
(GLMs). Stability selection (SS) is a promising method proposed for solving
this problem. Although SS provides practical variable selection criteria, it is
computationally demanding because it needs to fit GLMs to many re-sampled
datasets. We propose a novel approximate inference algorithm that can conduct
SS without the repeated fitting. The algorithm is based on the replica method
of statistical mechanics and vector approximate message passing of information
theory. For datasets characterized by rotation-invariant matrix ensembles, we
derive state evolution equations that macroscopically describe the dynamics of
the proposed algorithm. We also show that their fixed points are consistent
with the replica symmetric solution obtained by the replica method. Numerical
experiments indicate that the algorithm exhibits fast convergence and high
approximation accuracy for both synthetic and real-world data.
- Abstract(参考訳): 一般化線形モデル(GLM)の変数選択問題を考察する。
安定選択(SS)はこの問題を解決するための有望な手法である。
SSは実用的な変数選択基準を提供するが、多くの再サンプリングデータセットにGLMを適合させる必要があるため、計算的に要求される。
繰り返し適合することなくssを実行できる新しい近似推定アルゴリズムを提案する。
このアルゴリズムは、統計力学のレプリカ法と情報理論のベクトル近似メッセージパッシング法に基づいている。
回転不変行列アンサンブルを特徴とするデータセットに対して,提案アルゴリズムのダイナミクスを大局的に記述した状態進化方程式を導出する。
また、それらの固定点はレプリカ法で得られたレプリカ対称解と一致していることを示す。
数値実験により、このアルゴリズムは合成データと実世界のデータの両方に対して高速収束と高い近似精度を示すことが示された。
関連論文リスト
- Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - A unified consensus-based parallel ADMM algorithm for high-dimensional
regression with combined regularizations [3.280169909938912]
並列交互乗算器 (ADMM) は大規模分散データセットの処理に有効であることが広く認識されている。
提案アルゴリズムは,財務事例の信頼性,安定性,スケーラビリティを示す。
論文 参考訳(メタデータ) (2023-11-21T03:30:38Z) - SIGMA: Scale-Invariant Global Sparse Shape Matching [50.385414715675076]
非剛体形状の正確なスパース対応を生成するための新しい混合整数プログラミング(MIP)法を提案する。
いくつかの挑戦的な3Dデータセットに対して,スパースな非剛性マッチングの最先端結果を示す。
論文 参考訳(メタデータ) (2023-08-16T14:25:30Z) - Best-Subset Selection in Generalized Linear Models: A Fast and
Consistent Algorithm via Splicing Technique [0.6338047104436422]
ベストサブセットセクションは、このタイプの問題の聖杯として広く見なされている。
軽度条件下での最適部分集合回復のためのアルゴリズムを提案し,提案した。
我々の実装は、一般的な変数選択ツールキットと比較して約4倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2023-08-01T03:11:31Z) - Probabilistic Unrolling: Scalable, Inverse-Free Maximum Likelihood
Estimation for Latent Gaussian Models [69.22568644711113]
我々は,モンテカルロサンプリングと反復線形解法を組み合わせた確率的アンローリングを導入し,行列逆転を回避した。
理論的解析により,解法の繰り返しによる解法の解法と逆転が最大値推定の勾配推定を高速化することを示した。
シミュレーションおよび実データ実験において、確率的アンロールは、モデル性能の損失を最小限に抑えながら、勾配EMよりも桁違いに高速な潜在ガウスモデルを学習することを示した。
論文 参考訳(メタデータ) (2023-06-05T21:08:34Z) - Structured model selection via $\ell_1-\ell_2$ optimization [1.933681537640272]
構造化力学系を同定する学習手法を開発した。
候補関数の集合が有界系を成すとき、その回復は安定で有界であることを示す。
論文 参考訳(メタデータ) (2023-05-27T12:51:26Z) - A model-free feature selection technique of feature screening and random
forest based recursive feature elimination [0.0]
質量特徴を持つ超高次元データのモデルフリー特徴選択法を提案する。
提案手法は選択整合性を示し, 弱正則条件下では$L$整合性を示す。
論文 参考訳(メタデータ) (2023-02-15T03:39:16Z) - Test Set Sizing Via Random Matrix Theory [91.3755431537592]
本稿ではランダム行列理論の手法を用いて、単純な線形回帰に対して理想的なトレーニング-テストデータ分割を求める。
それは「理想」を整合性計量を満たすものとして定義し、すなわち経験的モデル誤差は実際の測定ノイズである。
本論文は,任意のモデルのトレーニングとテストサイズを,真に最適な方法で解決した最初の論文である。
論文 参考訳(メタデータ) (2021-12-11T13:18:33Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z) - Analysis of Bayesian Inference Algorithms by the Dynamical Functional
Approach [2.8021833233819486]
学生自明なシナリオにおいて,大ガウス潜在変数モデルを用いて近似推論のアルゴリズムを解析する。
完全データモデルマッチングの場合、レプリカ法から派生した静的順序パラメータの知識により、効率的なアルゴリズム更新が得られる。
論文 参考訳(メタデータ) (2020-01-14T17:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。