論文の概要: A Two-Stage Variable Selection Approach for Correlated High Dimensional
Predictors
- arxiv url: http://arxiv.org/abs/2103.13357v1
- Date: Wed, 24 Mar 2021 17:28:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-25 13:47:22.661849
- Title: A Two-Stage Variable Selection Approach for Correlated High Dimensional
Predictors
- Title(参考訳): 相関型高次元予測器の2段階可変選択法
- Authors: Zhiyuan Li
- Abstract要約: 本稿では,グループ変数選択問題に対して,変数クラスタリングステージとグループ変数ステージを組み合わせた2段階アプローチを提案する。
変数クラスタリングステージは、データからの情報を使用してグループ構造を見つけ、既存のグループ変数選択メソッドのパフォーマンスを向上させる。
この2段階法は, 予測精度, アクティブな予測器の選択精度において, より優れた性能を示す。
- 参考スコア(独自算出の注目度): 4.8128078741263725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When fitting statistical models, some predictors are often found to be
correlated with each other, and functioning together. Many group variable
selection methods are developed to select the groups of predictors that are
closely related to the continuous or categorical response. These existing
methods usually assume the group structures are well known. For example,
variables with similar practical meaning, or dummy variables created by
categorical data. However, in practice, it is impractical to know the exact
group structure, especially when the variable dimensional is large. As a
result, the group variable selection results may be selected. To solve the
challenge, we propose a two-stage approach that combines a variable clustering
stage and a group variable stage for the group variable selection problem. The
variable clustering stage uses information from the data to find a group
structure, which improves the performance of the existing group variable
selection methods. For ultrahigh dimensional data, where the predictors are
much larger than observations, we incorporated a variable screening method in
the first stage and shows the advantages of such an approach. In this article,
we compared and discussed the performance of four existing group variable
selection methods under different simulation models, with and without the
variable clustering stage. The two-stage method shows a better performance, in
terms of the prediction accuracy, as well as in the accuracy to select active
predictors. An athlete's data is also used to show the advantages of the
proposed method.
- Abstract(参考訳): 統計モデルに適合する場合、いくつかの予測器は互いに関連付けられ、一緒に機能することがしばしば見出される。
多くの群変数選択法は、連続的あるいはカテゴリー的応答と密接な関係を持つ予測者のグループを選択するために開発されている。
これらの既存の方法は通常群構造がよく知られていると仮定する。
例えば、同様の実践的な意味を持つ変数や、分類データによって生成されるダミー変数などです。
しかし、実際には、厳密な群構造、特に変数次元が大きいときを知ることは現実的ではない。
その結果、グループ変数選択結果を選択することができる。
この課題を解決するために,グループ変数選択問題に対して,可変クラスタリングステージとグループ変数ステージを組み合わせた2段階アプローチを提案する。
変数クラスタリングステージは、データからの情報を使用してグループ構造を見つけ、既存のグループ変数選択メソッドのパフォーマンスを向上させる。
予測器が観測値よりもはるかに大きい超高次元データに対して,我々は第1段階に可変スクリーニング手法を導入し,そのような手法の利点を示した。
本稿では,既存の4つのグループ変数選択手法の性能を,変数クラスタリングステージの有無に関わらず,異なるシミュレーションモデルで比較検討した。
この2段階法は, 予測精度, アクティブな予測器の選択精度において, より優れた性能を示す。
アスリートのデータは、提案手法の利点を示すためにも用いられる。
関連論文リスト
- Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Scalable variable selection for two-view learning tasks with projection
operators [0.0]
本稿では,2視点設定やベクトル値による教師付き学習問題に対して,新しい変数選択法を提案する。
当社のフレームワークは,データサンプルの数が数百万にものぼる,非常に大規模な選択タスクを処理できる。
論文 参考訳(メタデータ) (2023-07-04T08:22:05Z) - Selective inference using randomized group lasso estimators for general models [3.4034453928075865]
この手法は指数関数的な家族分布の使用、および過分散カウントデータに対する準様モデリングを含む。
ランダム化群正規化最適化問題について検討した。
選択されたモデルにおける回帰パラメータの信頼領域は、ウォルド型領域の形式をとり、境界体積を持つことを示す。
論文 参考訳(メタデータ) (2023-06-24T01:14:26Z) - HiPerformer: Hierarchically Permutation-Equivariant Transformer for Time
Series Forecasting [56.95572957863576]
本稿では,同じ群を構成する成分間の関係と群間の関係を考察した階層的置換同変モデルを提案する。
実世界のデータを用いた実験により,提案手法が既存の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-05-14T05:11:52Z) - DiscoVars: A New Data Analysis Perspective -- Application in Variable
Selection for Clustering [0.0]
基礎となる学習課題によらず,変数の重要度を決定するために,新しいデータ分析視点を提案する。
本稿では,データから重要な変数を選択するための新しい手法を提案する。
ユーザフレンドリーなインターフェース開発環境であるShinyアプリとして,当社のツールを紹介します。
論文 参考訳(メタデータ) (2023-04-08T10:57:19Z) - Composite Feature Selection using Deep Ensembles [130.72015919510605]
本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
本稿では,特徴選択モデルのアンサンブルを用いて予測グループを探索する,新しいディープラーニングアーキテクチャを提案する。
発見群と基底真理の類似性を測定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-11-01T17:49:40Z) - Improving Group Lasso for high-dimensional categorical data [0.90238471756546]
群ラッソ(英: Group Lasso)は、連続変数または分類変数を選択するためのよく知られた効率的なアルゴリズムである。
グループラッソのスパース解を得るための2段階の手順を提案する。
本手法は,予測精度やモデル次元に関して,技術アルゴリズムの状態よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-10-25T13:43:57Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - VC-PCR: A Prediction Method based on Supervised Variable Selection and
Clustering [1.1470070927586016]
本稿では,変分選択と変分クラスタリングを監督する予測手法であるVC-PCRを提案する。
実データおよびシミュレーションデータを用いた実験により、VC-PCRは競合する手法と比較して、クラスタ構造が存在する場合の予測、変数選択、クラスタリング性能が向上することを示した。
論文 参考訳(メタデータ) (2022-02-02T11:41:39Z) - Group Heterogeneity Assessment for Multilevel Models [68.95633278540274]
多くのデータセットは固有のマルチレベル構造を含む。
この構造を考慮に入れることは、そのようなデータ上で行われた統計分析の正確性と校正にとって重要である。
本稿では,データ内のグループ化変数のレベルの違いを効率的に評価するフレキシブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-06T12:42:04Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。