論文の概要: Correlated Feature Selection with Extended Exclusive Group Lasso
- arxiv url: http://arxiv.org/abs/2002.12460v1
- Date: Thu, 27 Feb 2020 21:55:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 07:57:39.500610
- Title: Correlated Feature Selection with Extended Exclusive Group Lasso
- Title(参考訳): 拡張排他的群lassoによる特徴選択の相関
- Authors: Yuxin Sun and Benny Chain and Samuel Kaski and John Shawe-Taylor
- Abstract要約: ラッソとその関連アルゴリズムは、スパース解が自然に情報的特徴の集合を識別して以来、広く使われている。
これにより、生物学的問題におけるそのようなアルゴリズムの使用が制限され、遺伝子のような特徴がしばしば経路で一緒に働くようになり、高度に相関した特徴がセットされる。
排他的群 Lasso を解くための高速アルゴリズムを提案し、基礎となる群構造が不明な場合の解を導入する。
- 参考スコア(独自算出の注目度): 17.23182851188781
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many high dimensional classification or regression problems set in a
biological context, the complete identification of the set of informative
features is often as important as predictive accuracy, since this can provide
mechanistic insight and conceptual understanding. Lasso and related algorithms
have been widely used since their sparse solutions naturally identify a set of
informative features. However, Lasso performs erratically when features are
correlated. This limits the use of such algorithms in biological problems,
where features such as genes often work together in pathways, leading to sets
of highly correlated features. In this paper, we examine the performance of a
Lasso derivative, the exclusive group Lasso, in this setting. We propose fast
algorithms to solve the exclusive group Lasso, and introduce a solution to the
case when the underlying group structure is unknown. The solution combines
stability selection with random group allocation and introduction of artificial
features. Experiments with both synthetic and real-world data highlight the
advantages of this proposed methodology over Lasso in comprehensive selection
of informative features.
- Abstract(参考訳): 生物学的文脈で設定された多くの高次元の分類や回帰問題において、情報的特徴の集合の完全な同定は、機械的洞察と概念的理解を提供するため、予測精度と同じくらいに重要である。
ラッソとその関連アルゴリズムは、スパース解が自然に情報的特徴の集合を識別して以来、広く使われている。
しかしながら、lassoは特徴が関連付けられると不規則に機能する。
これにより、生物学的問題におけるそのようなアルゴリズムの使用が制限され、遺伝子のような特徴はしばしば経路内で協調して働き、高い相関性を持つ特徴の集合に繋がる。
本稿では,ラッソの排他的群であるラッソ誘導体の性能について検討する。
排他的群 Lasso を解くための高速アルゴリズムを提案し、基礎となる群構造が不明な場合に解を導入する。
このソリューションは、安定性選択とランダムグループ割り当てと人工的な特徴の導入を組み合わせたものである。
合成データと実世界のデータの両方を用いた実験は、情報的特徴の包括的選択において、ラッソに対して提案された手法の利点を強調している。
関連論文リスト
- Cascaded two-stage feature clustering and selection via separability and consistency in fuzzy decision systems [8.048511956662336]
特徴選択は、計算複雑性を減らし、モデルパフォーマンスを改善し、オーバーフィッティングのリスクを軽減することができるため、機械学習において重要なテクニックである。
本稿では,ファジィ決定システムのための2段階特徴クラスタリングと選択アルゴリズムを提案する。
提案アルゴリズムの有効性を18の公開データセットと現実世界の統合失調症データセットを用いて評価した。
論文 参考訳(メタデータ) (2024-07-22T02:44:32Z) - Enhancing Neural Subset Selection: Integrating Background Information into Set Representations [53.15923939406772]
対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。
これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
論文 参考訳(メタデータ) (2024-02-05T16:09:35Z) - A Performance-Driven Benchmark for Feature Selection in Tabular Deep
Learning [131.2910403490434]
データサイエンティストは通常、データセットにできるだけ多くの機能を集め、既存の機能から新しい機能を設計する。
既存のタブ形式の特徴選択のためのベンチマークでは、古典的な下流モデル、おもちゃの合成データセット、あるいは下流のパフォーマンスに基づいて特徴セレクタを評価していない。
変換器を含む下流ニューラルネットワーク上で評価された課題のある特徴選択ベンチマークを構築した。
また,従来の特徴選択法よりも高い性能を有するニューラルネットワークのための,Lassoのインプット・グラディエント・ベース・アナログも提案する。
論文 参考訳(メタデータ) (2023-11-10T05:26:10Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Composite Feature Selection using Deep Ensembles [130.72015919510605]
本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
本稿では,特徴選択モデルのアンサンブルを用いて予測グループを探索する,新しいディープラーニングアーキテクチャを提案する。
発見群と基底真理の類似性を測定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-11-01T17:49:40Z) - Ensemble feature selection with clustering for analysis of
high-dimensional, correlated clinical data in the search for Alzheimer's
disease biomarkers [0.0]
多変量特徴セレクタから特徴選択アンサンブルを作成するための新しいフレームワークを提案する。
我々は,事前処理段階における集合的階層的クラスタリングを用いて,相関した特徴群が生み出すバイアスを考慮に入れた。
これらの手法はアルツハイマー病(AD)の研究から現実の2つのデータセットに適用された。
論文 参考訳(メタデータ) (2022-07-06T01:03:50Z) - Neural Active Learning with Performance Guarantees [37.16062387461106]
非パラメトリックなレシエーションにおけるストリーミング環境におけるアクティブラーニングの問題について検討する。
我々は最近提案されたニューラル・タンジェント・カーネル(NTK)近似ツールを用いて、アルゴリズムが操作する特徴空間と学習したモデルを上から計算する適切なニューラル埋め込みを構築する。
論文 参考訳(メタデータ) (2021-06-06T20:44:23Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。