論文の概要: Robust Principal Component Analysis via Discriminant Sample Weight Learning
- arxiv url: http://arxiv.org/abs/2408.12366v1
- Date: Thu, 22 Aug 2024 13:06:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-23 13:53:43.114194
- Title: Robust Principal Component Analysis via Discriminant Sample Weight Learning
- Title(参考訳): 識別型サンプル重み学習によるロバスト主成分分析
- Authors: Yingzhuo Deng, Ke Hu, Bo Li, Yao Zhang,
- Abstract要約: 本稿では,データ平均とPCAプロジェクション行列の両方を,外乱量を含むデータから識別可能なサンプル重みを学習することにより,ロバストな推定法を提案する。
玩具データ,UCIデータセット,顔データセットを用いた実験により,提案手法の有効性が示された。
- 参考スコア(独自算出の注目度): 19.326459200801928
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Principal component analysis (PCA) is a classical feature extraction method, but it may be adversely affected by outliers, resulting in inaccurate learning of the projection matrix. This paper proposes a robust method to estimate both the data mean and the PCA projection matrix by learning discriminant sample weights from data containing outliers. Each sample in the dataset is assigned a weight, and the proposed algorithm iteratively learns the weights, the mean, and the projection matrix, respectively. Specifically, when the mean and the projection matrix are available, via fine-grained analysis of outliers, a weight for each sample is learned hierarchically so that outliers have small weights while normal samples have large weights. With the learned weights available, a weighted optimization problem is solved to estimate both the data mean and the projection matrix. Because the learned weights discriminate outliers from normal samples, the adverse influence of outliers is mitigated due to the corresponding small weights. Experiments on toy data, UCI dataset, and face dataset demonstrate the effectiveness of the proposed method in estimating the mean and the projection matrix from the data containing outliers.
- Abstract(参考訳): 主成分分析 (PCA) は古典的特徴抽出法であるが, 外れ値に悪影響を及ぼす可能性があり, プロジェクション行列の精度が低下する。
本稿では,データ平均とPCAプロジェクション行列の両方を,外乱量を含むデータから識別可能なサンプル重みを学習することにより,ロバストな推定法を提案する。
データセットの各サンプルには重みが割り当てられ、提案アルゴリズムは、それぞれ重み、平均、投射行列を反復的に学習する。
具体的には、平均値と投射行列が利用できる場合、各サンプルの重量が階層的に学習され、通常のサンプルが大きな重量を持つのに対して、各サンプルの重量は小さな重量を持つ。
学習した重みが利用可能であれば、データ平均と投影行列の両方を推定するために重み付け最適化問題を解く。
学習重量が正常試料から外れ値を識別するため, 外れ値の悪影響は, 対応する小重量値によって緩和される。
玩具データ, UCIデータセット, 顔データセットを用いた実験により, 平均および投射行列の推定における提案手法の有効性が示された。
関連論文リスト
- Dataset-Free Weight-Initialization on Restricted Boltzmann Machine [0.0]
フィードフォワードニューラルネットワークでは,データセットフリーの重み初期化手法が開発されている。
本稿では,Bernoulli--Bernoulli RBMの統計力学解析に基づくデータセットフリー重量初期化法を導出する。
論文 参考訳(メタデータ) (2024-09-12T02:25:04Z) - Robust bilinear factor analysis based on the matrix-variate $t$
distribution [2.6530267536011913]
$t$ディストリビューション($t$fa)に基づく因子分析は、重み付きまたは汚染されたデータの一般的な要因を抽出するのに有用である。
本稿では,$t$分布(t$bfa)に基づく新しいロバストな因子分析モデルを提案する。
重み付き行列データや汚染された行列データに対して、行変数と列変数の両方の共通要素を同時に抽出することができる。
論文 参考訳(メタデータ) (2024-01-04T11:15:44Z) - Sharp-SSL: Selective high-dimensional axis-aligned random projections
for semi-supervised learning [16.673022545571566]
本稿では,高次元半教師付き学習問題に対する新しい手法を提案する。
これは、データの多くの軸方向のランダムな投影に適用される低次元プロシージャの結果の慎重な集約に基づいている。
論文 参考訳(メタデータ) (2023-04-18T17:49:02Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Optimal Variable Clustering for High-Dimensional Matrix Valued Data [3.1138411427556445]
本稿では,行列形式で配置された特徴に対して,新しい潜在変数モデルを提案する。
軽度条件下では,高次元設定でクラスタリングの整合性が得られる。
この重みを使用すれば、アルゴリズムが最小値の速度最適化であることが保証されるという意味で、最適な重みを識別する。
論文 参考訳(メタデータ) (2021-12-24T02:13:04Z) - Robust factored principal component analysis for matrix-valued outlier
accommodation and detection [4.228971753938522]
Factored PCA (FPCA) は行列データに対するPCAの確率的拡張である。
行列データに対するFPCA(RFPCA)の堅牢な拡張を提案する。
RFPCAは適応的に減量し、ロバストな推定値が得られる。
論文 参考訳(メタデータ) (2021-12-13T16:12:22Z) - Weight Vector Tuning and Asymptotic Analysis of Binary Linear
Classifiers [82.5915112474988]
本稿では,スカラーによる判別器の分解をパラメータ化することで,ジェネリックバイナリ線形分類器の重みベクトルチューニングを提案する。
また,重みベクトルチューニングは,高推定雑音下での線形判別分析(LDA)の性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2021-10-01T17:50:46Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Attentional-Biased Stochastic Gradient Descent [74.49926199036481]
深層学習におけるデータ不均衡やラベルノイズ問題に対処するための証明可能な手法(ABSGD)を提案する。
本手法は運動量SGDの簡易な修正であり,各試料に個別の重み付けを行う。
ABSGDは追加コストなしで他の堅牢な損失と組み合わせられるほど柔軟である。
論文 参考訳(メタデータ) (2020-12-13T03:41:52Z) - Evaluating representations by the complexity of learning low-loss
predictors [55.94170724668857]
下流タスクの解決に使用されるデータの表現を評価することの問題点を考察する。
本稿では,関心のあるタスクにおける低損失を実現する表現の上に,予測器を学習する複雑性によって表現の質を測定することを提案する。
論文 参考訳(メタデータ) (2020-09-15T22:06:58Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。