Fugu-MT 論文翻訳(概要): Beyond PCA: A Probabilistic Gram-Schmidt Approach to Feature Extraction

論文の概要: Beyond PCA: A Probabilistic Gram-Schmidt Approach to Feature Extraction

arxiv url: http://arxiv.org/abs/2311.09386v2
Date: Tue, 6 Feb 2024 03:42:12 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-07 19:51:52.308675
Title: Beyond PCA: A Probabilistic Gram-Schmidt Approach to Feature Extraction
Title（参考訳）: PCAを超えて: 特徴抽出のための確率的文法シュミットアプローチ
Authors: Bahram Yaghooti, Netanel Raviv, Bruno Sinopoli
Abstract要約: データ間の非線形依存関係の存在下での線形特徴抽出は教師なし学習における根本的な課題である。本稿では,余剰次元を検出・マッピングするために,確率的グラムシュミット型直交化法を提案する。我々は,PCAと最先端の線形特徴抽出アルゴリズムよりも優れた性能を示す合成および実世界のデータセットのシミュレーション結果を提供する。
参考スコア（独自算出の注目度）: 8.287206589886878
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Linear feature extraction at the presence of nonlinear dependencies among the data is a fundamental challenge in unsupervised learning. We propose using a probabilistic Gram-Schmidt (GS) type orthogonalization process in order to detect and map out redundant dimensions. Specifically, by applying the GS process over a family of functions which presumably captures the nonlinear dependencies in the data, we construct a series of covariance matrices that can either be used to identify new large-variance directions, or to remove those dependencies from the principal components. In the former case, we provide information-theoretic guarantees in terms of entropy reduction. In the latter, we prove that under certain assumptions the resulting algorithms detect and remove nonlinear dependencies whenever those dependencies lie in the linear span of the chosen function family. Both proposed methods extract linear features from the data while removing nonlinear redundancies. We provide simulation results on synthetic and real-world datasets which show improved performance over PCA and state-of-the-art linear feature extraction algorithms, both in terms of variance maximization of the extracted features, and in terms of improved performance of classification algorithms. Additionally, our methods are comparable and often outperform the non-linear method of kernel PCA.
Abstract（参考訳）: データ間の非線形依存の存在下での線形特徴抽出は教師なし学習における基本的な課題である。本稿では,余剰次元を検出・マップアウトするために,確率的グラムシュミット型直交化法を提案する。具体的には、データ内の非線形依存関係をキャプチャするであろう関数群にGSプロセスを適用することで、新しい大きな分散方向を識別したり、主成分からそれらの依存関係を取り除くために使用できる一連の共分散行列を構築する。前者の場合、エントロピー低減の観点から情報理論的な保証を提供する。後者では、ある仮定の下で、選択された関数ファミリーの線形スパンに依存関係がある場合、結果のアルゴリズムが非線型依存を検出し、除去することを示す。どちらの手法も非線形冗長性を取り除きながらデータから線形特徴を抽出する。抽出された特徴の分散最大化と分類アルゴリズムの性能向上の両方の観点から,pcaおよび最先端線形特徴抽出アルゴリズムの性能向上を示す合成および実世界のデータセットのシミュレーション結果を提供する。さらに,本手法はカーネルPCAの非線形手法よりも優れていることが多い。

関連論文リスト

Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文参考訳（メタデータ） (2024-03-08T18:50:19Z)
Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文参考訳（メタデータ） (2024-03-06T16:31:56Z)
Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文参考訳（メタデータ） (2023-10-17T08:04:45Z)
Nonlinear Feature Aggregation: Two Algorithms driven by Theory [45.3190496371625]
現実世界の機械学習アプリケーションは、膨大な機能によって特徴付けられ、計算やメモリの問題を引き起こす。一般集約関数を用いて特徴量の非線形変換を集約する次元還元アルゴリズム(NonLinCFA)を提案する。また、アルゴリズムを合成および実世界のデータセット上でテストし、回帰および分類タスクを実行し、競合性能を示す。
論文参考訳（メタデータ） (2023-06-19T19:57:33Z)
Subspace Learning for Feature Selection via Rank Revealing QR Factorization: Unsupervised and Hybrid Approaches with Non-negative Matrix Factorization and Evolutionary Algorithm [0.0]
ランク明示QR(RRQR)因子化は、新しい教師なし特徴選択技術として最も情報性の高い特徴を得るのに活用される。フィルタベース手法としてRRQRとラッパーベース手法として遺伝的アルゴリズムを組み合わせたハイブリッド特徴選択アルゴリズムを提案する。提案アルゴリズムは、教師付き、教師なし、および半教師付き設定における最先端の特徴選択アルゴリズムと比較した場合、信頼性と堅牢性を示す。
論文参考訳（メタデータ） (2022-10-02T04:04:47Z)
Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文参考訳（メタデータ） (2020-12-29T04:08:38Z)
Adaptive Graph-based Generalized Regression Model for Unsupervised Feature Selection [11.214334712819396]
非相関的かつ識別的特徴の選択は、教師なしの機能選択の重要な問題である。非相関制約と $ell_2,1$-norm 正規化によって課される新しい一般化回帰モデルを提案する。それは同時に同じ近所に属するこれらのデータポイントの分散を減らすこと無相関および差別的な特徴を選ぶことができます。
論文参考訳（メタデータ） (2020-12-27T09:07:26Z)
Joint Adaptive Graph and Structured Sparsity Regularization for Unsupervised Feature Selection [6.41804410246642]
本稿では,共同適応グラフと構造付き空間正規化unsupervised feature selection (JASFS)法を提案する。最適な機能のサブセットがグループで選択され、選択された機能の数が自動的に決定される。 8つのベンチマーク実験の結果,提案手法の有効性と有効性を示した。
論文参考訳（メタデータ） (2020-10-09T08:17:04Z)
The data-driven physical-based equations discovery using evolutionary approach [77.34726150561087]
与えられた観測データから数学的方程式を発見するアルゴリズムについて述べる。このアルゴリズムは遺伝的プログラミングとスパース回帰を組み合わせたものである。解析方程式の発見や偏微分方程式(PDE)の発見にも用いられる。
論文参考訳（メタデータ） (2020-04-03T17:21:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。