論文の概要: Composite Feature Selection using Deep Ensembles
- arxiv url: http://arxiv.org/abs/2211.00631v1
- Date: Tue, 1 Nov 2022 17:49:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 14:29:42.680163
- Title: Composite Feature Selection using Deep Ensembles
- Title(参考訳): ディープアンサンブルを用いた複合特徴選択
- Authors: Fergus Imrie, Alexander Norcliffe, Pietro Lio, Mihaela van der Schaar
- Abstract要約: 本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
本稿では,特徴選択モデルのアンサンブルを用いて予測グループを探索する,新しいディープラーニングアーキテクチャを提案する。
発見群と基底真理の類似性を測定するための新しい尺度を提案する。
- 参考スコア(独自算出の注目度): 130.72015919510605
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many real world problems, features do not act alone but in combination
with each other. For example, in genomics, diseases might not be caused by any
single mutation but require the presence of multiple mutations. Prior work on
feature selection either seeks to identify individual features or can only
determine relevant groups from a predefined set. We investigate the problem of
discovering groups of predictive features without predefined grouping. To do
so, we define predictive groups in terms of linear and non-linear interactions
between features. We introduce a novel deep learning architecture that uses an
ensemble of feature selection models to find predictive groups, without
requiring candidate groups to be provided. The selected groups are sparse and
exhibit minimum overlap. Furthermore, we propose a new metric to measure
similarity between discovered groups and the ground truth. We demonstrate the
utility of our model on multiple synthetic tasks and semi-synthetic chemistry
datasets, where the ground truth structure is known, as well as an image
dataset and a real-world cancer dataset.
- Abstract(参考訳): 現実世界の多くの問題では、機能は単独ではなく、互いに組み合わせて機能する。
例えば、ゲノム学では、病気は単一の突然変異によって引き起こされるのではなく、複数の突然変異が存在する必要がある。
機能選択に関する事前の作業は、個々の特徴を特定しようとするか、事前定義された集合からのみ関連グループを決定することができる。
本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
そのため、特徴間の線形および非線形相互作用の観点から予測群を定義する。
本稿では,特徴選択モデルのアンサンブルを用いて予測群を抽出し,候補群を提供することなく,新たなディープラーニングアーキテクチャを提案する。
選択された群はスパースであり、最小重なりを示す。
さらに,発見群と基底真理との類似性を測定するための新しい尺度を提案する。
我々は,複数の合成タスクと半合成化学データセットにおいて,基底の真理構造が知られ,画像データセットと実世界のがんデータセットが有効であることを示す。
関連論文リスト
- Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Automated Model Selection for Tabular Data [0.1797555376258229]
Rの混合効果線形モデルライブラリは、モデル設計において対話的な機能の組み合わせを提供することができる。
特徴的相互作用を取り入れたデータセットの予測のためのモデル選択プロセスを自動化することを目的としている。
このフレームワークには、優先順位に基づくランダムグリッド検索とグレディ検索という、2つの異なる機能選択のアプローチが含まれている。
論文 参考訳(メタデータ) (2024-01-01T21:41:20Z) - Sparse and geometry-aware generalisation of the mutual information for joint discriminative clustering and feature selection [19.066989850964756]
GEMINIと呼ばれる相互情報の幾何を考慮した一般化を最大化しようとする識別クラスタリングモデルを導入する。
このアルゴリズムは,特徴探索の負担を回避し,識別クラスタリングモデルのみを設計しながら,高次元データや大量のサンプルに対して容易にスケーラブルである。
以上の結果から,Sparse GEMINIは競合アルゴリズムであり,関連基準や事前仮説を使わずに,クラスタリングに関して変数の関連するサブセットを選択することができることがわかった。
論文 参考訳(メタデータ) (2023-02-07T10:52:04Z) - Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular
data [81.43750358586072]
本稿では,サンプルをサブグループに体系的に階層化するフレームワークであるData-IQを提案する。
実世界の4つの医療データセットに対するData-IQの利点を実験的に実証した。
論文 参考訳(メタデータ) (2022-10-24T08:57:55Z) - Ensemble feature selection with clustering for analysis of
high-dimensional, correlated clinical data in the search for Alzheimer's
disease biomarkers [0.0]
多変量特徴セレクタから特徴選択アンサンブルを作成するための新しいフレームワークを提案する。
我々は,事前処理段階における集合的階層的クラスタリングを用いて,相関した特徴群が生み出すバイアスを考慮に入れた。
これらの手法はアルツハイマー病(AD)の研究から現実の2つのデータセットに適用された。
論文 参考訳(メタデータ) (2022-07-06T01:03:50Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Flexible variable selection in the presence of missing data [0.0]
本稿では,非パラメトリックな変数選択アルゴリズムと多重計算を組み合わせることで,非ランダムなデータが存在する場合のフレキシブルなパネルの開発を行う。
提案手法の動作特性は良好であり,より高い分類性能と可変選択性能を有するパネルが得られた。
論文 参考訳(メタデータ) (2022-02-25T21:41:03Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Commutative Lie Group VAE for Disentanglement Learning [96.32813624341833]
本研究では,データに表される因子の変動を同変的に反映する基盤構造を見いだすこととして,非絡み合い学習を考察する。
グループベースの非絡み合い学習を実現するために、Communative Lie Group VAEというシンプルなモデルが導入された。
実験により,本モデルでは,教師なしの非絡み合い表現を効果的に学習し,余分な制約を伴わずに最先端のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-06-07T07:03:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。