論文の概要: Cluster Stability Selection
- arxiv url: http://arxiv.org/abs/2201.00494v1
- Date: Mon, 3 Jan 2022 06:28:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 15:29:51.569902
- Title: Cluster Stability Selection
- Title(参考訳): クラスター安定性選択
- Authors: Gregory Faletto, Jacob Bien
- Abstract要約: 安定性の選択は、多くのサブサンプルで一貫して選択される機能のみを返すことで、機能選択メソッドをより安定させる。
クラスタ安定性の選択を導入し、データに高い相関クラスタが存在するという実践者の知識を活用する。
まとめると、クラスタ安定性の選択は両方の世界のベストを享受し、安定かつ良好な予測性能を持つスパース選択セットを得る。
- 参考スコア(独自算出の注目度): 2.3986080077861787
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stability selection (Meinshausen and Buhlmann, 2010) makes any feature
selection method more stable by returning only those features that are
consistently selected across many subsamples. We prove (in what is, to our
knowledge, the first result of its kind) that for data containing highly
correlated proxies for an important latent variable, the lasso typically
selects one proxy, yet stability selection with the lasso can fail to select
any proxy, leading to worse predictive performance than the lasso alone.
We introduce cluster stability selection, which exploits the practitioner's
knowledge that highly correlated clusters exist in the data, resulting in
better feature rankings than stability selection in this setting. We consider
several feature-combination approaches, including taking a weighted average of
the features in each important cluster where weights are determined by the
frequency with which cluster members are selected, which we show leads to
better predictive models than previous proposals.
We present generalizations of theoretical guarantees from Meinshausen and
Buhlmann (2010) and Shah and Samworth (2012) to show that cluster stability
selection retains the same guarantees. In summary, cluster stability selection
enjoys the best of both worlds, yielding a sparse selected set that is both
stable and has good predictive performance.
- Abstract(参考訳): 安定選択 (Meinshausen and Buhlmann, 2010) は、任意の特徴選択法をより安定にし、多くのサブサンプルで一貫して選択される特徴のみを返す。
我々は、重要な潜在変数に対する高相関なプロキシを含むデータに対して、ラッソは一般に1つのプロキシを選択するが、ラッソとの安定性の選択は任意のプロキシを選択することに失敗し、ラッソ単独よりも予測性能が悪くなることを示す。
クラスタの安定性の選択は、データに高い相関性を持つクラスタが存在するという実践者の知識を活用し、この設定では、安定性の選択よりも優れた特徴ランキングをもたらす。
重み付けがクラスタメンバの選択頻度によって決定される重要なクラスタ毎の機能の平均を重み付けすることで,従来の提案よりも優れた予測モデルが得られることを示す。
meinshausen and buhlmann (2010) と shah and samworth (2012) による理論的な保証の一般化を行い、クラスタ安定性の選択が同じ保証を保持することを示した。
まとめると、クラスタ安定性の選択は両方の世界のベストを享受し、安定かつ良好な予測性能を持つスパース選択セットを得る。
関連論文リスト
- On the Selection Stability of Stability Selection and Its Applications [2.263635133348731]
本稿では,安定度選択フレームワークの全体的な安定性を評価するため,確立された安定度推定器の利用を拡大することを目的とする。
安定性推定器は、得られた結果の堅牢性を反映する参照として機能し、安定性を向上させるために最適な正規化値を特定するのに役立つ。
論文 参考訳(メタデータ) (2024-11-14T00:02:54Z) - Stability and Multigroup Fairness in Ranking with Uncertain Predictions [61.76378420347408]
我々の研究はランキング関数について考察している。分類タスクの個々の予測からランキング上の分布へのマップ。
ランキング関数の2つの側面、すなわち予測における摂動に対する安定性と、個人とサブグループの両方に対する公正性に焦点を当てる。
我々の研究は、不確実性に敏感なランキングが、グループと個人レベルの公正性の保証とを自然に補間していることを示している。
論文 参考訳(メタデータ) (2024-02-14T17:17:05Z) - An information theoretic approach to quantify the stability of feature
selection and ranking algorithms [0.0]
本稿では,ジェンセン・シャノンの発散に基づく情報理論のアプローチを提案し,そのロバスト性を定量化する。
他の安定度測度とは異なり、この測度は、完全なランクリスト、特徴サブセット、そしてより研究の少ない部分的なランクリストといった、異なるアルゴリズムの結果に適合する。
本研究では, この安定性指標を, 完全に制御された方法で生成したデータと併用し, 特徴ランク付けと選択結果に関するSpearmansランキング相関やKunchevasインデックスなどの一般的な指標と比較する。
論文 参考訳(メタデータ) (2024-02-07T22:17:37Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Fed-CBS: A Heterogeneity-Aware Client Sampling Mechanism for Federated
Learning via Class-Imbalance Reduction [76.26710990597498]
本研究では,ランダムに選択したクライアントからのグループデータのクラス不均衡が,性能の大幅な低下につながることを示す。
我々のキーとなる観測に基づいて、我々は効率的なクライアントサンプリング機構、すなわちフェデレートクラスバランスサンプリング(Fed-CBS)を設計する。
特に、クラス不均衡の尺度を提案し、その後、同型暗号化を用いてプライバシー保護方式でこの尺度を導出する。
論文 参考訳(メタデータ) (2022-09-30T05:42:56Z) - Loss-guided Stability Selection [0.0]
LassoやBoostingのようなモデル選択手順は、実際のデータに過度に適合する傾向があることはよく知られている。
標準安定選択は、グローバルな基準、すなわち家族ごとのエラー率に基づいている。
選択された損失関数を付加的な検証ステップで尊重する安定性選択変種を提案する。
論文 参考訳(メタデータ) (2022-02-10T11:20:25Z) - Fast Estimation Method for the Stability of Ensemble Feature Selectors [8.984888893275714]
機能セレクタは、より良い解釈と堅牢な予測のためにテキスト化可能であることが好ましい。
特徴セレクタのシミュレータを提案し,それをアンサンブル特徴セレクタの安定性の高速な推定に適用する。
論文 参考訳(メタデータ) (2021-08-03T13:22:18Z) - Employing an Adjusted Stability Measure for Multi-Criteria Model Fitting
on Data Sets with Similar Features [0.1127980896956825]
提案手法は,2つの確立したアプローチと比較して,同じあるいはより良い予測性能が得られることを示す。
このアプローチでは、関係のない機能や冗長な機能を避けながら、関連する機能を選択することに成功しています。
多くの類似した特徴を持つデータセットの場合、特徴選択安定性は調整された安定性尺度で評価されなければならない。
論文 参考訳(メタデータ) (2021-06-15T12:48:07Z) - Characterizing Fairness Over the Set of Good Models Under Selective
Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。
到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。
選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2021-01-02T02:11:37Z) - Selective Classification Can Magnify Disparities Across Groups [89.14499988774985]
選択的分類は平均的精度を向上させることができるが、既存の精度格差を同時に増大させることができる。
禁忌の増大は、一部のグループでのアキュラシーを減少させることもある。
我々は,グループ間で類似のフルカバレッジ精度を実現する分散ロバストモデルを訓練し,選択分類が各グループを均一に改善することを示す。
論文 参考訳(メタデータ) (2020-10-27T08:51:30Z) - Stable and consistent density-based clustering via multiparameter
persistence [77.34726150561087]
トポロジカルデータ解析による次数-リップス構成について考察する。
我々は,入力データの摂動に対する安定性を,通信間距離を用いて解析する。
私たちはこれらのメソッドを、Persistableと呼ばれる密度ベースのクラスタリングのためのパイプラインに統合します。
論文 参考訳(メタデータ) (2020-05-18T19:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。