論文の概要: Unlabeled Principal Component Analysis and Matrix Completion
- arxiv url: http://arxiv.org/abs/2101.09446v2
- Date: Mon, 9 Oct 2023 07:23:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 17:43:33.241017
- Title: Unlabeled Principal Component Analysis and Matrix Completion
- Title(参考訳): ラベルなし主成分分析と行列補完
- Authors: Yunzhen Yao, Liangzu Peng and Manolis C. Tsakiris
- Abstract要約: 本稿では、列のエントリが置換によって破損したデータ行列から、ロバストな主成分分析を導入する。
UPCAに類似したフレーバーの理論とアルゴリズムを導出する。
合成データ、顔画像、教育および医療記録の実験は、データ民営化やレコードリンクのような応用のためのアルゴリズムの可能性を明らかにする。
- 参考スコア(独自算出の注目度): 25.663593359761336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce robust principal component analysis from a data matrix in which
the entries of its columns have been corrupted by permutations, termed
Unlabeled Principal Component Analysis (UPCA). Using algebraic geometry, we
establish that UPCA is a well-defined algebraic problem in the sense that the
only matrices of minimal rank that agree with the given data are
row-permutations of the ground-truth matrix, arising as the unique solutions of
a polynomial system of equations. Further, we propose an efficient two-stage
algorithmic pipeline for UPCA suitable for the practically relevant case where
only a fraction of the data have been permuted. Stage-I employs outlier-robust
PCA methods to estimate the ground-truth column-space. Equipped with the
column-space, Stage-II applies recent methods for unlabeled sensing to restore
the permuted data. Allowing for missing entries on top of permutations in UPCA
leads to the problem of unlabeled matrix completion, for which we derive theory
and algorithms of similar flavor. Experiments on synthetic data, face images,
educational and medical records reveal the potential of our algorithms for
applications such as data privatization and record linkage.
- Abstract(参考訳): 本稿では、列のエントリが置換によって破損したデータ行列から頑健な主成分分析を導入し、Unlabeled principal Component Analysis (UPCA) と呼ぶ。
代数幾何学を用いて、UPCA は与えられたデータに一致する最小ランクの行列だけが基底トラス行列の行置換であり、方程式の多項式系の一意解として生じるという意味で、十分に定義された代数的問題であることを示す。
さらに,データのごく一部が置換された場合に適したUPCAのための効率的な2段階アルゴリズムパイプラインを提案する。
stage-i では、表層柱空間を推定するために outlier-robust pca 法を用いる。
列空間を備えるstage-iiは、ラベルなしセンシングの最近の手法を適用し、置換されたデータを復元する。
UPCAの置換の上位に欠落するエントリが与えられると、ラベルなし行列完備化の問題が起こり、そこで同様のフレーバーの理論とアルゴリズムが導かれる。
合成データ、顔画像、教育および医療記録の実験は、データ民営化やレコードリンクのような応用のためのアルゴリズムの可能性を明らかにする。
関連論文リスト
- Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Empirical Bayes Linked Matrix Decomposition [0.0]
この問題に対する経験的変分ベイズ的アプローチを提案する。
単一行列文脈において新規な反復的計算手法について述べる。
提案手法は,下層の低ランク信号の回復に関して,異なるシナリオ下で非常によく機能することを示す。
論文 参考訳(メタデータ) (2024-08-01T02:13:11Z) - Synergistic eigenanalysis of covariance and Hessian matrices for enhanced binary classification [72.77513633290056]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
本手法は複雑なパターンと関係を抽出し,分類性能を向上する。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - Weakly supervised covariance matrices alignment through Stiefel matrices
estimation for MEG applications [64.20396555814513]
本稿では,Mixing Model Stiefel Adaptation (MSA)と呼ばれる時系列データに対する新しいドメイン適応手法を提案する。
我々は、ドメイン間の等価な信号分散とペアの対応を確立することにより、ターゲット領域における豊富なラベルのないデータを利用して効果的な予測を行う。
MSAは、Cam-CANデータセットのMEG信号を用いて、タスクの変動を伴う脳年齢回帰の最近の手法より優れている。
論文 参考訳(メタデータ) (2024-01-24T19:04:49Z) - Spectral Entry-wise Matrix Estimation for Low-Rank Reinforcement
Learning [53.445068584013896]
低ランク構造を持つ強化学習(RL)における行列推定問題について検討した。
低ランク帯では、回収される行列は期待される腕の報酬を指定し、低ランクマルコフ決定プロセス(MDP)では、例えばMDPの遷移カーネルを特徴付ける。
簡単なスペクトルベースの行列推定手法は,行列の特異部分空間を効率よく復元し,ほぼ最小の入力誤差を示すことを示す。
論文 参考訳(メタデータ) (2023-10-10T17:06:41Z) - A Perceptron-based Fine Approximation Technique for Linear Separation [0.0]
本稿では,正あるいは負のラベル付きデータポイント間でセパレータ超平面を見つけることを目的とした,新しいオンライン学習手法を提案する。
人工ニューロンの重みとバイアスは、高次元空間の超平面と直接関連付けられる。
実験結果から,Perceptronアルゴリズムよりも効率がよいことが示された。
論文 参考訳(メタデータ) (2023-09-12T08:35:24Z) - Recovering Simultaneously Structured Data via Non-Convex Iteratively
Reweighted Least Squares [0.8702432681310401]
線形観測から多種多様低次元構造に固執するデータを復元する新しいアルゴリズムを提案する。
IRLS法は,低/複合状態の計測に好適であることを示す。
論文 参考訳(メタデータ) (2023-06-08T06:35:47Z) - Covariance matrix preparation for quantum principal component analysis [0.8258451067861933]
主成分分析 (PCA) はデータ解析における次元還元法である。
密度行列の対角化に基づくPCAの量子アルゴリズムが定式化されている。
本手法は分子基底状態データセットに対して数値的に実装する。
論文 参考訳(メタデータ) (2022-04-07T15:11:42Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Semi-Supervised Learning with Meta-Gradient [123.26748223837802]
半教師付き学習における簡単なメタ学習アルゴリズムを提案する。
その結果,提案アルゴリズムは最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-07-08T08:48:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。