論文の概要: Accuracy and stability of solar variable selection comparison under
complicated dependence structures
- arxiv url: http://arxiv.org/abs/2007.15614v2
- Date: Wed, 16 Dec 2020 18:30:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 13:32:07.687882
- Title: Accuracy and stability of solar variable selection comparison under
complicated dependence structures
- Title(参考訳): 複雑な依存構造下における太陽変数選択比較の精度と安定性
- Authors: Ning Xu, Timothy C.G. Fisher, Jian Hong
- Abstract要約: サブサンプル順序付き最小角度回帰(Solar)の経験的可変選択特性に着目した。
以前の研究では、太陽は最小角度の回帰を伴ういくつかの既知の高次元問題をほとんど緩和していることが示されている。
- 参考スコア(独自算出の注目度): 6.837167110907022
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we focus on the empirical variable-selection peformance of
subsample-ordered least angle regression (Solar) -- a novel ultrahigh
dimensional redesign of lasso -- on the empirical data with complicated
dependence structures and, hence, severe multicollinearity and grouping effect
issues. Previous researches show that Solar largely alleviates several known
high-dimensional issues with least-angle regression and $\mathcal{L}_1$
shrinkage. Also, With the same computation load, solar yields substantiali
mprovements over two lasso solvers (least-angle regression for lasso and
coordinate-descent) in terms of the sparsity (37-64\% reduction in the average
number of selected variables), stability and accuracy of variable selection.
Simulations also demonstrate that solar enhances the robustness of variable
selection to different settings of the irrepresentable condition and to
variations in the dependence structures assumed in regression analysis. To
confirm that the improvements are also available for empirical researches, we
choose the prostate cancer data and the Sydney house price data and apply two
lasso solvers, elastic net and Solar on them for comparison. The results shows
that (i) lasso is affected by the grouping effect and randomly drop variables
with high correlations, resulting unreliable and uninterpretable results; (ii)
elastic net is more robust to grouping effect; however, it completely lose
variable-selection sparsity when the dependence structure of the data is
complicated; (iii) solar demonstrates its superior robustness to complicated
dependence structures and grouping effect, returning variable-selection results
with better stability and sparsity. The code can be found at
https://github.com/isaac2math/solar_application
- Abstract(参考訳): 本稿では、複雑な構造を持つ経験的データに基づいて、サブサンプル順序付き最小角度回帰(Solar)の実験的変数選択性能(Solar)に着目し、重度多重線形性とグループ化効果の問題を考察する。
以前の研究では、太陽は最小角回帰と$\mathcal{L}_1$収縮という既知の高次元問題をほとんど緩和している。
また、同じ計算負荷で、太陽収量は2つのラッソ解法(ラッソと座標偏差の最小角度回帰)に対して、スパーシリティ(選択変数の平均数の37-64\%低減)、安定性、変数選択の精度で実質的な改善を行う。
また、太陽は変動選択のロバスト性を、非表示条件の異なる設定や回帰解析で仮定される依存構造の変化に拡張することを示した。
この改良が実証的な研究にも利用可能であることを確認するため、前立腺がんデータとシドニー・ハウスの価格データを選択し、2つのlassoソルバ、elastic netとsolarを比較対象とする。
その結果は
(i)ラスソは群れ効果の影響を受け、高い相関関係を持つ変数をランダムに減少させ、信頼できない結果と解釈できない結果をもたらす。
(二) 弾性ネットは、グループ化効果に強いが、データの依存構造が複雑である場合には、変数選択間隔が完全に失われる。
(iii)太陽は複雑な依存構造やグループ化効果に対して優れたロバスト性を示し、安定性とスパース性が向上した変数選択結果を返す。
コードはhttps://github.com/isaac2math/solar_applicationにある。
関連論文リスト
- Local Learning for Covariate Selection in Nonparametric Causal Effect Estimation with Latent Variables [13.12743473333296]
非実験データから因果効果を推定することは、科学の多くの分野における根本的な問題である。
非パラメトリック因果効果推定における共変量選択のための新しい局所学習手法を提案する。
我々は、合成データと実世界のデータの両方に関する広範な実験を通じて、アルゴリズムを検証する。
論文 参考訳(メタデータ) (2024-11-25T12:08:54Z) - Causal Representation Learning from Multiple Distributions: A General Setting [21.73088044465267]
本稿では,複数の分布からの因果表現学習の一般的,完全に非パラメトリックな設定について述べる。
因果的影響に対する適切な変化条件と、潜伏変数上のグラフの空間的制約の下で、基礎となる有向非巡回グラフのモラル化グラフを復元できることが示される。
場合によっては、ほとんどの潜伏変数はコンポーネントワイド変換まで回収できる。
論文 参考訳(メタデータ) (2024-02-07T17:51:38Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - Dual-sPLS: a family of Dual Sparse Partial Least Squares regressions for
feature selection and prediction with tunable sparsity; evaluation on
simulated and near-infrared (NIR) data [1.6099403809839032]
この論文で示された変種であるDual-sPLSは、古典的なPLS1アルゴリズムを一般化する。
正確な予測と効率的な解釈のバランスを提供する。
コードはRでオープンソースパッケージとして提供される。
論文 参考訳(メタデータ) (2023-01-17T21:50:35Z) - Stable Learning via Sparse Variable Independence [41.632242102167844]
共変量シフト一般化問題に対するSVI(Sparse Variable Independence)を提案する。
有限サンプル設定下でのサンプル再加重の不完全性を補うために、スペーサ性制約を導入する。
合成データセットと実世界のデータセットの両方の実験は、SVIの改良を実証している。
論文 参考訳(メタデータ) (2022-12-02T05:59:30Z) - On the Strong Correlation Between Model Invariance and Generalization [54.812786542023325]
一般化は、見えないデータを分類するモデルの能力をキャプチャする。
不変性はデータの変換におけるモデル予測の一貫性を測定する。
データセット中心の視点から、あるモデルの精度と不変性は異なるテストセット上で線形に相関している。
論文 参考訳(メタデータ) (2022-07-14T17:08:25Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Deconfounded Score Method: Scoring DAGs with Dense Unobserved
Confounding [101.35070661471124]
本研究では,観測データ分布に特徴的フットプリントが残っており,突発的・因果的影響を解消できることを示す。
汎用ソルバで実装し,高次元問題へのスケールアップが可能なスコアベース因果検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-28T11:07:59Z) - Solar: $L_0$ solution path averaging for fast and accurate variable
selection in high-dimensional data [8.077207211102458]
我々は,新しい変数選択アルゴリズム,サブサンプル順序付き最小角回帰(ソラー)を提案する。
太陽の収量は、ラッソ負荷の3分の1以下であり、変動選択の空間性と精度の観点から、ラッソよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-07-30T19:45:59Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - CausalVAE: Structured Causal Disentanglement in Variational Autoencoder [52.139696854386976]
変分オートエンコーダ(VAE)の枠組みは、観測から独立した因子をアンタングルするために一般的に用いられる。
本稿では, 因果内因性因子を因果内因性因子に変換する因果層を含むVOEベースの新しいフレームワークCausalVAEを提案する。
その結果、CausalVAEが学習した因果表現は意味論的に解釈可能であり、DAG(Directed Acyclic Graph)としての因果関係は精度良く同定された。
論文 参考訳(メタデータ) (2020-04-18T20:09:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。