論文の概要: Beyond PCA: A Probabilistic Gram-Schmidt Approach to Feature Extraction
- arxiv url: http://arxiv.org/abs/2311.09386v1
- Date: Wed, 15 Nov 2023 21:29:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 17:26:57.859574
- Title: Beyond PCA: A Probabilistic Gram-Schmidt Approach to Feature Extraction
- Title(参考訳): PCAを超えて: 特徴抽出のための確率的文法シュミットアプローチ
- Authors: Bahram Yaghooti, Netanel Raviv, Bruno Sinopoli
- Abstract要約: データ間の非線形依存関係の存在下での線形特徴抽出は教師なし学習における根本的な課題である。
本稿では,余剰次元を検出・マップアウトするために,確率的グラムシュミット(PGS)型化プロセスを提案する。
我々は,PCAと最先端の線形特徴抽出アルゴリズムよりも優れた性能を示す合成および実世界のデータセットのシミュレーション結果を提供する。
- 参考スコア(独自算出の注目度): 8.287206589886878
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Linear feature extraction at the presence of nonlinear dependencies among the
data is a fundamental challenge in unsupervised learning. We propose using a
Probabilistic Gram-Schmidt (PGS) type orthogonalization process in order to
detect and map out redundant dimensions. Specifically, by applying the PGS
process over any family of functions which presumably captures the nonlinear
dependencies in the data, we construct a series of covariance matrices that can
either be used to remove those dependencies from the principal components, or
to identify new large-variance directions. In the former case, we prove that
under certain assumptions the resulting algorithms detect and remove nonlinear
dependencies whenever those dependencies lie in the linear span of the chosen
function family. In the latter, we provide information-theoretic guarantees in
terms of entropy reduction. Both proposed methods extract linear features from
the data while removing nonlinear redundancies. We provide simulation results
on synthetic and real-world datasets which show improved performance over PCA
and state-of-the-art linear feature extraction algorithms, both in terms of
variance maximization of the extracted features, and in terms of improved
performance of classification algorithms.
- Abstract(参考訳): データ間の非線形依存の存在下での線形特徴抽出は教師なし学習における基本的な課題である。
本稿では,確率的グラムシュミット(PGS)型直交化プロセスを用いて冗長次元の検出とマッピングを行う。
具体的には、データ内の非線形依存をキャプチャする任意の関数群にpgsプロセスを適用することで、これらの依存を主成分から取り除くか、新しい大きな分散方向を特定するために使用できる一連の共分散行列を構築する。
前者の場合、ある仮定の下で、選択された関数ファミリーの線形スパンに依存関係がある場合、結果のアルゴリズムが非線型依存を検出し、除去することを示す。
後者ではエントロピー低減の観点から情報理論の保証を提供する。
どちらの手法も非線形冗長性を取り除きながらデータから線形特徴を抽出する。
抽出された特徴の分散最大化と分類アルゴリズムの性能向上の両方の観点から,pcaおよび最先端線形特徴抽出アルゴリズムの性能向上を示す合成および実世界のデータセットのシミュレーション結果を提供する。
関連論文リスト
- Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Nonlinear Feature Aggregation: Two Algorithms driven by Theory [45.3190496371625]
現実世界の機械学習アプリケーションは、膨大な機能によって特徴付けられ、計算やメモリの問題を引き起こす。
一般集約関数を用いて特徴量の非線形変換を集約する次元還元アルゴリズム(NonLinCFA)を提案する。
また、アルゴリズムを合成および実世界のデータセット上でテストし、回帰および分類タスクを実行し、競合性能を示す。
論文 参考訳(メタデータ) (2023-06-19T19:57:33Z) - Subspace Learning for Feature Selection via Rank Revealing QR
Factorization: Unsupervised and Hybrid Approaches with Non-negative Matrix
Factorization and Evolutionary Algorithm [0.0]
ランク明示QR(RRQR)因子化は、新しい教師なし特徴選択技術として最も情報性の高い特徴を得るのに活用される。
フィルタベース手法としてRRQRとラッパーベース手法として遺伝的アルゴリズムを組み合わせたハイブリッド特徴選択アルゴリズムを提案する。
提案アルゴリズムは、教師付き、教師なし、および半教師付き設定における最先端の特徴選択アルゴリズムと比較した場合、信頼性と堅牢性を示す。
論文 参考訳(メタデータ) (2022-10-02T04:04:47Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Adaptive Graph-based Generalized Regression Model for Unsupervised
Feature Selection [11.214334712819396]
非相関的かつ識別的特徴の選択は、教師なしの機能選択の重要な問題である。
非相関制約と $ell_2,1$-norm 正規化によって課される新しい一般化回帰モデルを提案する。
それは同時に同じ近所に属するこれらのデータ ポイントの分散を減らすこと無相関および差別的な特徴を選ぶことができます。
論文 参考訳(メタデータ) (2020-12-27T09:07:26Z) - Joint Adaptive Graph and Structured Sparsity Regularization for
Unsupervised Feature Selection [6.41804410246642]
本稿では,共同適応グラフと構造付き空間正規化unsupervised feature selection (JASFS)法を提案する。
最適な機能のサブセットがグループで選択され、選択された機能の数が自動的に決定される。
8つのベンチマーク実験の結果,提案手法の有効性と有効性を示した。
論文 参考訳(メタデータ) (2020-10-09T08:17:04Z) - The data-driven physical-based equations discovery using evolutionary
approach [77.34726150561087]
与えられた観測データから数学的方程式を発見するアルゴリズムについて述べる。
このアルゴリズムは遺伝的プログラミングとスパース回帰を組み合わせたものである。
解析方程式の発見や偏微分方程式(PDE)の発見にも用いられる。
論文 参考訳(メタデータ) (2020-04-03T17:21:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。