論文の概要: RaSE: A Variable Screening Framework via Random Subspace Ensembles
- arxiv url: http://arxiv.org/abs/2102.03892v1
- Date: Sun, 7 Feb 2021 19:24:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:29:30.705761
- Title: RaSE: A Variable Screening Framework via Random Subspace Ensembles
- Title(参考訳): RaSE:ランダムサブスペースアンサンブルによる可変スクリーニングフレームワーク
- Authors: Ye Tian, Yang Feng
- Abstract要約: 可変スクリーニングのための新しいフレームワークRandom Subspace Ensemble (RaSE)を提案する。
RaSEは、複数の予測器をカバーする可能性のあるランダム部分空間の品質を評価することで機能する。
確実なスクリーニング特性とランク一貫性を享受できることが示されている。
- 参考スコア(独自算出の注目度): 7.675822266933702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variable screening methods have been shown to be effective in dimension
reduction under the ultra-high dimensional setting. Most existing screening
methods are designed to rank the predictors according to their individual
contributions to the response. As a result, variables that are marginally
independent but jointly dependent with the response could be missed. In this
work, we propose a new framework for variable screening, Random Subspace
Ensemble (RaSE), which works by evaluating the quality of random subspaces that
may cover multiple predictors. This new screening framework can be naturally
combined with any subspace evaluation criterion, which leads to an array of
screening methods. The framework is capable to identify signals with no
marginal effect or with high-order interaction effects. It is shown to enjoy
the sure screening property and rank consistency. We also develop an iterative
version of RaSE screening with theoretical support. Extensive simulation
studies and real-data analysis show the effectiveness of the new screening
framework.
- Abstract(参考訳): 可変スクリーニング法は超高次元設定下での次元減少に有効であることが示されている。
ほとんどの既存のスクリーニング方法は、応答に対する個々の貢献に応じて予測子をランク付けするように設計されている。
結果として、わずかな独立性を持つが、応答に共同で依存する変数を見逃すことができた。
本研究では,変数探索のための新しいフレームワークであるランダム部分空間アンサンブル(RaSE)を提案し,複数の予測器をカバーするランダム部分空間の品質を評価する。
この新しいスクリーニングフレームワークは、任意のサブスペース評価基準と自然に組み合わせることができ、スクリーニング方法の配列につながります。
このフレームワークは、マージン効果や高次相互作用効果のない信号を識別することができる。
確実なスクリーニング特性とランク一貫性を享受できることが示されている。
また,理論的支援を伴うRaSEスクリーニングの反復版も開発している。
詳細なシミュレーション研究と実データ解析により,新しいスクリーニングフレームワークの有効性が示された。
関連論文リスト
- Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework [77.45983464131977]
我々は、RAGモデルの予測が誤りであり、現実のアプリケーションにおいて制御不能なリスクをもたらす可能性がどの程度あるかに焦点を当てる。
本研究は,RAGの予測に影響を及ぼす2つの重要な潜伏要因を明らかにする。
我々は,これらの要因をモデルに誘導し,その応答に与える影響を解析する,反実的プロンプトフレームワークを開発した。
論文 参考訳(メタデータ) (2024-09-24T14:52:14Z) - Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Sample size planning for conditional counterfactual mean estimation with
a K-armed randomized experiment [0.0]
K$のランダム化実験で十分なサンプルサイズを決定する方法を示す。
政策木を用いてサブグループを学習し、公開可能な大規模なランダム化実験データセットにおいて、我々の名目上の保証を評価する。
論文 参考訳(メタデータ) (2024-03-06T20:37:29Z) - Variational Inference with Coverage Guarantees in Simulation-Based Inference [18.818573945984873]
コンフォーマル化補正ニューラル変分推論(CANVI)を提案する。
CANVIは各候補に基づいて共形予測器を構築し、予測効率と呼ばれる計量を用いて予測器を比較し、最も効率的な予測器を返す。
我々は,CANVIが生成する領域の予測効率の低い境界を証明し,その近似に基づいて,後部近似の品質と予測領域の予測効率の関係について検討する。
論文 参考訳(メタデータ) (2023-05-23T17:24:04Z) - Flexible variable selection in the presence of missing data [0.0]
本稿では,非パラメトリックな変数選択アルゴリズムと多重計算を組み合わせることで,非ランダムなデータが存在する場合のフレキシブルなパネルの開発を行う。
提案手法の動作特性は良好であり,より高い分類性能と可変選択性能を有するパネルが得られた。
論文 参考訳(メタデータ) (2022-02-25T21:41:03Z) - A novel interpretable machine learning system to generate clinical risk
scores: An application for predicting early mortality or unplanned
readmission in a retrospective cohort study [7.648642297930807]
本稿では,Shapley変数重要クラウド(ShapleyVIC)を用いた頑健で解釈可能な変数選択手法を提案する。
提案手法は,詳細な推論と透過的な変数選択のための総合的な変数寄与を評価し,可視化する。
早死にまたは未計画の可読性の研究において、ShapleyVICは41の候補変数のうち6つを選択し、良好な性能のモデルを作った。
論文 参考訳(メタデータ) (2022-01-10T11:22:06Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - RaSE: Random Subspace Ensemble Classification [12.599368232426631]
スパース分類のためのフレキシブルアンサンブル分類フレームワークRandom Subspace Ensemble (RaSE)を提案する。
RaSEアルゴリズムでは、多くの弱い学習者を集約し、各弱い学習者はランダムな部分空間の集合から最適に選択された部分空間で訓練された基底分類器である。
高次元のフレームワークでは、信号をカバーする部分空間が選択されることを保証するために、乱部分空間の数が非常に大きい必要がある。
論文 参考訳(メタデータ) (2020-06-16T01:14:38Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。