論文の概要: RaSE: A Variable Screening Framework via Random Subspace Ensembles
- arxiv url: http://arxiv.org/abs/2102.03892v1
- Date: Sun, 7 Feb 2021 19:24:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:29:30.705761
- Title: RaSE: A Variable Screening Framework via Random Subspace Ensembles
- Title(参考訳): RaSE:ランダムサブスペースアンサンブルによる可変スクリーニングフレームワーク
- Authors: Ye Tian, Yang Feng
- Abstract要約: 可変スクリーニングのための新しいフレームワークRandom Subspace Ensemble (RaSE)を提案する。
RaSEは、複数の予測器をカバーする可能性のあるランダム部分空間の品質を評価することで機能する。
確実なスクリーニング特性とランク一貫性を享受できることが示されている。
- 参考スコア(独自算出の注目度): 7.675822266933702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variable screening methods have been shown to be effective in dimension
reduction under the ultra-high dimensional setting. Most existing screening
methods are designed to rank the predictors according to their individual
contributions to the response. As a result, variables that are marginally
independent but jointly dependent with the response could be missed. In this
work, we propose a new framework for variable screening, Random Subspace
Ensemble (RaSE), which works by evaluating the quality of random subspaces that
may cover multiple predictors. This new screening framework can be naturally
combined with any subspace evaluation criterion, which leads to an array of
screening methods. The framework is capable to identify signals with no
marginal effect or with high-order interaction effects. It is shown to enjoy
the sure screening property and rank consistency. We also develop an iterative
version of RaSE screening with theoretical support. Extensive simulation
studies and real-data analysis show the effectiveness of the new screening
framework.
- Abstract(参考訳): 可変スクリーニング法は超高次元設定下での次元減少に有効であることが示されている。
ほとんどの既存のスクリーニング方法は、応答に対する個々の貢献に応じて予測子をランク付けするように設計されている。
結果として、わずかな独立性を持つが、応答に共同で依存する変数を見逃すことができた。
本研究では,変数探索のための新しいフレームワークであるランダム部分空間アンサンブル(RaSE)を提案し,複数の予測器をカバーするランダム部分空間の品質を評価する。
この新しいスクリーニングフレームワークは、任意のサブスペース評価基準と自然に組み合わせることができ、スクリーニング方法の配列につながります。
このフレームワークは、マージン効果や高次相互作用効果のない信号を識別することができる。
確実なスクリーニング特性とランク一貫性を享受できることが示されている。
また,理論的支援を伴うRaSEスクリーニングの反復版も開発している。
詳細なシミュレーション研究と実データ解析により,新しいスクリーニングフレームワークの有効性が示された。
関連論文リスト
- Top-K Pairwise Ranking: Bridging the Gap Among Ranking-Based Measures for Multi-Label Classification [120.37051160567277]
本稿では,Top-K Pairwise Ranking(TKPR)という新しい尺度を提案する。
一連の分析により、TKPRは既存のランキングベースの尺度と互換性があることが示されている。
一方,データ依存縮約法という新しい手法に基づいて,提案手法の急激な一般化を確立する。
論文 参考訳(メタデータ) (2024-07-09T09:36:37Z) - Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Sample size planning for conditional counterfactual mean estimation with
a K-armed randomized experiment [0.0]
K$のランダム化実験で十分なサンプルサイズを決定する方法を示す。
政策木を用いてサブグループを学習し、公開可能な大規模なランダム化実験データセットにおいて、我々の名目上の保証を評価する。
論文 参考訳(メタデータ) (2024-03-06T20:37:29Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Variational Inference with Coverage Guarantees in Simulation-Based Inference [18.818573945984873]
コンフォーマル化補正ニューラル変分推論(CANVI)を提案する。
CANVIは各候補に基づいて共形予測器を構築し、予測効率と呼ばれる計量を用いて予測器を比較し、最も効率的な予測器を返す。
我々は,CANVIが生成する領域の予測効率の低い境界を証明し,その近似に基づいて,後部近似の品質と予測領域の予測効率の関係について検討する。
論文 参考訳(メタデータ) (2023-05-23T17:24:04Z) - Flexible variable selection in the presence of missing data [0.0]
本稿では,非パラメトリックな変数選択アルゴリズムと多重計算を組み合わせることで,非ランダムなデータが存在する場合のフレキシブルなパネルの開発を行う。
提案手法の動作特性は良好であり,より高い分類性能と可変選択性能を有するパネルが得られた。
論文 参考訳(メタデータ) (2022-02-25T21:41:03Z) - A novel interpretable machine learning system to generate clinical risk
scores: An application for predicting early mortality or unplanned
readmission in a retrospective cohort study [7.648642297930807]
本稿では,Shapley変数重要クラウド(ShapleyVIC)を用いた頑健で解釈可能な変数選択手法を提案する。
提案手法は,詳細な推論と透過的な変数選択のための総合的な変数寄与を評価し,可視化する。
早死にまたは未計画の可読性の研究において、ShapleyVICは41の候補変数のうち6つを選択し、良好な性能のモデルを作った。
論文 参考訳(メタデータ) (2022-01-10T11:22:06Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - RaSE: Random Subspace Ensemble Classification [12.599368232426631]
スパース分類のためのフレキシブルアンサンブル分類フレームワークRandom Subspace Ensemble (RaSE)を提案する。
RaSEアルゴリズムでは、多くの弱い学習者を集約し、各弱い学習者はランダムな部分空間の集合から最適に選択された部分空間で訓練された基底分類器である。
高次元のフレームワークでは、信号をカバーする部分空間が選択されることを保証するために、乱部分空間の数が非常に大きい必要がある。
論文 参考訳(メタデータ) (2020-06-16T01:14:38Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Almost-Matching-Exactly for Treatment Effect Estimation under Network
Interference [73.23326654892963]
本研究では,観測ネットワーク上でユニットが接続されたランダム化実験から直接処理効果を回復するマッチング手法を提案する。
本手法は, 近傍グラフ内の一意部分グラフの個数にほぼ一致する。
論文 参考訳(メタデータ) (2020-03-02T15:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。