論文の概要: Greedy Search Algorithms for Unsupervised Variable Selection: A
Comparative Study
- arxiv url: http://arxiv.org/abs/2103.02687v1
- Date: Wed, 3 Mar 2021 21:10:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-05 14:53:39.002431
- Title: Greedy Search Algorithms for Unsupervised Variable Selection: A
Comparative Study
- Title(参考訳): 教師なし変数選択のための欲望探索アルゴリズム--比較研究
- Authors: Federico Zocco, Marco Maggipinto, Gian Antonio Susto and Se\'an
McLoone
- Abstract要約: 本稿では,非監視変数選択に基づく次元還元について述べる。
本稿では,7つの非監視勾配変数選択アルゴリズムの臨界評価について述べる。
本稿では,FSCA(Forward selection component analysis)アルゴリズムで説明された分散の遅延実装を初めて導入し,評価する。
- 参考スコア(独自算出の注目度): 3.4888132404740797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dimensionality reduction is a important step in the development of scalable
and interpretable data-driven models, especially when there are a large number
of candidate variables. This paper focuses on unsupervised variable selection
based dimensionality reduction, and in particular on unsupervised greedy
selection methods, which have been proposed by various researchers as
computationally tractable approximations to optimal subset selection. These
methods are largely distinguished from each other by the selection criterion
adopted, which include squared correlation, variance explained, mutual
information and frame potential. Motivated by the absence in the literature of
a systematic comparison of these different methods, we present a critical
evaluation of seven unsupervised greedy variable selection algorithms
considering both simulated and real world case studies. We also review the
theoretical results that provide performance guarantees and enable efficient
implementations for certain classes of greedy selection function, related to
the concept of submodularity. Furthermore, we introduce and evaluate for the
first time, a lazy implementation of the variance explained based forward
selection component analysis (FSCA) algorithm. Our experimental results show
that: (1) variance explained and mutual information based selection methods
yield smaller approximation errors than frame potential; (2) the lazy FSCA
implementation has similar performance to FSCA, while being an order of
magnitude faster to compute, making it the algorithm of choice for unsupervised
variable selection.
- Abstract(参考訳): ディメンショナリティの低減は、特に多数の候補変数がある場合、スケーラブルで解釈可能なデータ駆動モデルの開発において重要なステップです。
本論文では,非教師付き変数選択に基づく次元還元,特に,最適部分集合選択に対する計算的トラクタブル近似として,様々な研究者が提案した教師なし勾配選択法に焦点を当てる。
これらの方法は、二乗相関、説明分散、相互情報およびフレームポテンシャルを含む、採用された選択基準によって大きく区別される。
これらの異なる手法を体系的に比較した文献の欠如に動機づけられ,シミュレーションと実世界のケーススタディの両方を考慮した7つの教師なし変数選択アルゴリズムを批判的に評価した。
また、性能保証を提供する理論結果をレビューし、部分モジュラリティの概念に関連するある種の欲求選択関数に対する効率的な実装を可能にする。
さらに、前方選択成分分析(FSCA)アルゴリズムに基づいて説明された分散の遅延実装を初めて導入し、評価します。
実験結果から,(1) フレームポテンシャルよりも分散説明および相互情報に基づく選択法の方が近似誤差が小さいこと,(2) 遅延FSCAの実装はFSCAと同等の性能を持ち,しかも計算速度は桁違いに速く,教師なし変数選択のアルゴリズムとして選択できること,などが示唆された。
関連論文リスト
- An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Variable Substitution and Bilinear Programming for Aligning Partially Overlapping Point Sets [48.1015832267945]
本研究では,RPMアルゴリズムの最小化目的関数を用いて要求を満たす手法を提案する。
分岐とバウンド(BnB)アルゴリズムが考案され、パラメータのみに分岐し、収束率を高める。
実験による評価は,非剛性変形,位置雑音,外れ値に対する提案手法の高剛性を示す。
論文 参考訳(メタデータ) (2024-05-14T13:28:57Z) - Variable Selection for Kernel Two-Sample Tests [10.768155884359777]
カーネルの最大平均誤差(MMD)に基づくフレームワークを提案する。
我々は混合整数型プログラミングの定式化を提案し、性能保証付き精度および近似アルゴリズムを開発した。
合成および実データを用いた実験結果から,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-02-15T00:39:56Z) - Sharp Variance-Dependent Bounds in Reinforcement Learning: Best of Both
Worlds in Stochastic and Deterministic Environments [48.96971760679639]
マルコフ決定過程(MDP)の分散依存的後悔境界について検討する。
環境の微細な分散特性を特徴付けるための2つの新しい環境規範を提案する。
モデルに基づく手法では、MVPアルゴリズムの変種を設計する。
特に、この境界は極小かつ決定論的 MDP に対して同時に最適である。
論文 参考訳(メタデータ) (2023-01-31T06:54:06Z) - The Best Path Algorithm automatic variables selection via High
Dimensional Graphical Models [0.0]
本稿では,高次元グラフィカルモデルにおける変数自動選択手法を提案する。
アルゴリズムは、相互情報に基づいて、関心のノードに関する関連する変数を選択する。
アルゴリズムの幅広い実単語および公的なデータセットへの適用は、その可能性と有効性を強調している。
論文 参考訳(メタデータ) (2022-11-14T10:50:57Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Solving Large-Scale Multi-Objective Optimization via Probabilistic
Prediction Model [10.916384208006157]
効率的なLSMOPアルゴリズムは、巨大な検索空間から局所最適解を逃れる能力を持つべきである。
人口の多様性を維持することは、探索効率を向上させる効果的な方法の1つである。
LSMOP に取り組むために,トレンド予測モデルと LT-PPM と呼ばれる生成フィルタ戦略に基づく確率的予測モデルを提案する。
論文 参考訳(メタデータ) (2021-07-16T09:43:35Z) - Joint Adaptive Graph and Structured Sparsity Regularization for
Unsupervised Feature Selection [6.41804410246642]
本稿では,共同適応グラフと構造付き空間正規化unsupervised feature selection (JASFS)法を提案する。
最適な機能のサブセットがグループで選択され、選択された機能の数が自動的に決定される。
8つのベンチマーク実験の結果,提案手法の有効性と有効性を示した。
論文 参考訳(メタデータ) (2020-10-09T08:17:04Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Outlier Detection Ensemble with Embedded Feature Selection [42.8338013000469]
組込み特徴選択(ODEFS)を用いた外乱検出アンサンブルフレームワークを提案する。
各ランダムなサブサンプリングベースの学習コンポーネントに対して、ODEFSは、特徴選択と外れ値検出をペアのランキング式に統一する。
我々は、特徴選択と例選択を同時に最適化するために閾値付き自己評価学習を採用する。
論文 参考訳(メタデータ) (2020-01-15T13:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。