Fugu-MT 論文翻訳(概要): Greedy Search Algorithms for Unsupervised Variable Selection: A Comparative Study

論文の概要: Greedy Search Algorithms for Unsupervised Variable Selection: A Comparative Study

arxiv url: http://arxiv.org/abs/2103.02687v1
Date: Wed, 3 Mar 2021 21:10:26 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-05 14:53:39.002431
Title: Greedy Search Algorithms for Unsupervised Variable Selection: A Comparative Study
Title（参考訳）: 教師なし変数選択のための欲望探索アルゴリズム--比較研究
Authors: Federico Zocco, Marco Maggipinto, Gian Antonio Susto and Se\'an McLoone
Abstract要約: 本稿では,非監視変数選択に基づく次元還元について述べる。本稿では,7つの非監視勾配変数選択アルゴリズムの臨界評価について述べる。本稿では,FSCA(Forward selection component analysis)アルゴリズムで説明された分散の遅延実装を初めて導入し,評価する。
参考スコア（独自算出の注目度）: 3.4888132404740797
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Dimensionality reduction is a important step in the development of scalable and interpretable data-driven models, especially when there are a large number of candidate variables. This paper focuses on unsupervised variable selection based dimensionality reduction, and in particular on unsupervised greedy selection methods, which have been proposed by various researchers as computationally tractable approximations to optimal subset selection. These methods are largely distinguished from each other by the selection criterion adopted, which include squared correlation, variance explained, mutual information and frame potential. Motivated by the absence in the literature of a systematic comparison of these different methods, we present a critical evaluation of seven unsupervised greedy variable selection algorithms considering both simulated and real world case studies. We also review the theoretical results that provide performance guarantees and enable efficient implementations for certain classes of greedy selection function, related to the concept of submodularity. Furthermore, we introduce and evaluate for the first time, a lazy implementation of the variance explained based forward selection component analysis (FSCA) algorithm. Our experimental results show that: (1) variance explained and mutual information based selection methods yield smaller approximation errors than frame potential; (2) the lazy FSCA implementation has similar performance to FSCA, while being an order of magnitude faster to compute, making it the algorithm of choice for unsupervised variable selection.
Abstract（参考訳）: ディメンショナリティの低減は、特に多数の候補変数がある場合、スケーラブルで解釈可能なデータ駆動モデルの開発において重要なステップです。本論文では,非教師付き変数選択に基づく次元還元,特に,最適部分集合選択に対する計算的トラクタブル近似として,様々な研究者が提案した教師なし勾配選択法に焦点を当てる。これらの方法は、二乗相関、説明分散、相互情報およびフレームポテンシャルを含む、採用された選択基準によって大きく区別される。これらの異なる手法を体系的に比較した文献の欠如に動機づけられ,シミュレーションと実世界のケーススタディの両方を考慮した7つの教師なし変数選択アルゴリズムを批判的に評価した。また、性能保証を提供する理論結果をレビューし、部分モジュラリティの概念に関連するある種の欲求選択関数に対する効率的な実装を可能にする。さらに、前方選択成分分析(FSCA)アルゴリズムに基づいて説明された分散の遅延実装を初めて導入し、評価します。実験結果から,(1) フレームポテンシャルよりも分散説明および相互情報に基づく選択法の方が近似誤差が小さいこと,(2) 遅延FSCAの実装はFSCAと同等の性能を持ち,しかも計算速度は桁違いに速く,教師なし変数選択のアルゴリズムとして選択できること,などが示唆された。

関連論文リスト

Disentangling the Roles of Representation and Selection in Data Pruning [6.141776277655227]
我々はデータプルーニングをデータ表現と選択アルゴリズムの2つの重要なコンポーネントに分解する。我々の理論的および実証的な結果は、表現の重要な役割を浮き彫りにする。異なる選択アルゴリズムは異なる設定で優れており、どのアルゴリズムも他のアルゴリズムより一貫して優れているわけではない。
論文参考訳（メタデータ） (2025-07-04T15:25:04Z)
A High-Dimensional Feature Selection Algorithm Based on Multiobjective Differential Evolution [6.912442653561439]
多目的特徴選択は、最も差別的な特徴部分集合を決定する。提案手法は,最先端の多目的特徴選択手法よりも優れている。
論文参考訳（メタデータ） (2025-05-09T02:02:49Z)
An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。 2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文参考訳（メタデータ） (2024-09-04T14:36:20Z)
Variable Substitution and Bilinear Programming for Aligning Partially Overlapping Point Sets [48.1015832267945]
本研究では,RPMアルゴリズムの最小化目的関数を用いて要求を満たす手法を提案する。分岐とバウンド(BnB)アルゴリズムが考案され、パラメータのみに分岐し、収束率を高める。実験による評価は,非剛性変形,位置雑音,外れ値に対する提案手法の高剛性を示す。
論文参考訳（メタデータ） (2024-05-14T13:28:57Z)
Best-Subset Selection in Generalized Linear Models: A Fast and Consistent Algorithm via Splicing Technique [0.6338047104436422]
ベストサブセットセクションは、このタイプの問題の聖杯として広く見なされている。軽度条件下での最適部分集合回復のためのアルゴリズムを提案し,提案した。我々の実装は、一般的な変数選択ツールキットと比較して約4倍のスピードアップを実現している。
論文参考訳（メタデータ） (2023-08-01T03:11:31Z)
Variable Selection for Kernel Two-Sample Tests [10.768155884359777]
カーネルの最大平均誤差(MMD)に基づくフレームワークを提案する。我々は混合整数型プログラミングの定式化を提案し、性能保証付き精度および近似アルゴリズムを開発した。合成および実データを用いた実験結果から,本手法の優れた性能が示された。
論文参考訳（メタデータ） (2023-02-15T00:39:56Z)
Sharp Variance-Dependent Bounds in Reinforcement Learning: Best of Both Worlds in Stochastic and Deterministic Environments [48.96971760679639]
マルコフ決定過程(MDP)の分散依存的後悔境界について検討する。環境の微細な分散特性を特徴付けるための2つの新しい環境規範を提案する。モデルに基づく手法では、MVPアルゴリズムの変種を設計する。特に、この境界は極小かつ決定論的 MDP に対して同時に最適である。
論文参考訳（メタデータ） (2023-01-31T06:54:06Z)
The Best Path Algorithm automatic variables selection via High Dimensional Graphical Models [0.0]
本稿では,高次元グラフィカルモデルにおける変数自動選択手法を提案する。アルゴリズムは、相互情報に基づいて、関心のノードに関する関連する変数を選択する。アルゴリズムの幅広い実単語および公的なデータセットへの適用は、その可能性と有効性を強調している。
論文参考訳（メタデータ） (2022-11-14T10:50:57Z)
Compactness Score: A Fast Filter Method for Unsupervised Feature Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文参考訳（メタデータ） (2022-01-31T13:01:37Z)
Solving Large-Scale Multi-Objective Optimization via Probabilistic Prediction Model [10.916384208006157]
効率的なLSMOPアルゴリズムは、巨大な検索空間から局所最適解を逃れる能力を持つべきである。人口の多様性を維持することは、探索効率を向上させる効果的な方法の1つである。 LSMOP に取り組むために,トレンド予測モデルと LT-PPM と呼ばれる生成フィルタ戦略に基づく確率的予測モデルを提案する。
論文参考訳（メタデータ） (2021-07-16T09:43:35Z)
Information-theoretic Feature Selection via Tensor Decomposition and Submodularity [38.05393186002834]
本稿では,全ての変数の結合PMFの低ランクテンソルモデルを導入し,複雑性を緩和し,与えられた特徴量の分類性能を最大化する手法として間接的ターゲットを提案する。原目標変数の代わりにネイブベイズモデルの潜伏変数を間接的に予測することにより、濃度制約を受ける単調部分モジュラ函数として特徴選択問題を定式化することができる。
論文参考訳（メタデータ） (2020-10-30T10:36:46Z)
Joint Adaptive Graph and Structured Sparsity Regularization for Unsupervised Feature Selection [6.41804410246642]
本稿では,共同適応グラフと構造付き空間正規化unsupervised feature selection (JASFS)法を提案する。最適な機能のサブセットがグループで選択され、選択された機能の数が自動的に決定される。 8つのベンチマーク実験の結果,提案手法の有効性と有効性を示した。
論文参考訳（メタデータ） (2020-10-09T08:17:04Z)
Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文参考訳（メタデータ） (2020-06-15T10:08:39Z)
Outlier Detection Ensemble with Embedded Feature Selection [42.8338013000469]
組込み特徴選択(ODEFS)を用いた外乱検出アンサンブルフレームワークを提案する。各ランダムなサブサンプリングベースの学習コンポーネントに対して、ODEFSは、特徴選択と外れ値検出をペアのランキング式に統一する。我々は、特徴選択と例選択を同時に最適化するために閾値付き自己評価学習を採用する。
論文参考訳（メタデータ） (2020-01-15T13:14:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。