論文の概要: Unlabeled Principal Component Analysis and Matrix Completion
- arxiv url: http://arxiv.org/abs/2101.09446v2
- Date: Mon, 9 Oct 2023 07:23:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 17:43:33.241017
- Title: Unlabeled Principal Component Analysis and Matrix Completion
- Title(参考訳): ラベルなし主成分分析と行列補完
- Authors: Yunzhen Yao, Liangzu Peng and Manolis C. Tsakiris
- Abstract要約: 本稿では、列のエントリが置換によって破損したデータ行列から、ロバストな主成分分析を導入する。
UPCAに類似したフレーバーの理論とアルゴリズムを導出する。
合成データ、顔画像、教育および医療記録の実験は、データ民営化やレコードリンクのような応用のためのアルゴリズムの可能性を明らかにする。
- 参考スコア(独自算出の注目度): 25.663593359761336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce robust principal component analysis from a data matrix in which
the entries of its columns have been corrupted by permutations, termed
Unlabeled Principal Component Analysis (UPCA). Using algebraic geometry, we
establish that UPCA is a well-defined algebraic problem in the sense that the
only matrices of minimal rank that agree with the given data are
row-permutations of the ground-truth matrix, arising as the unique solutions of
a polynomial system of equations. Further, we propose an efficient two-stage
algorithmic pipeline for UPCA suitable for the practically relevant case where
only a fraction of the data have been permuted. Stage-I employs outlier-robust
PCA methods to estimate the ground-truth column-space. Equipped with the
column-space, Stage-II applies recent methods for unlabeled sensing to restore
the permuted data. Allowing for missing entries on top of permutations in UPCA
leads to the problem of unlabeled matrix completion, for which we derive theory
and algorithms of similar flavor. Experiments on synthetic data, face images,
educational and medical records reveal the potential of our algorithms for
applications such as data privatization and record linkage.
- Abstract(参考訳): 本稿では、列のエントリが置換によって破損したデータ行列から頑健な主成分分析を導入し、Unlabeled principal Component Analysis (UPCA) と呼ぶ。
代数幾何学を用いて、UPCA は与えられたデータに一致する最小ランクの行列だけが基底トラス行列の行置換であり、方程式の多項式系の一意解として生じるという意味で、十分に定義された代数的問題であることを示す。
さらに,データのごく一部が置換された場合に適したUPCAのための効率的な2段階アルゴリズムパイプラインを提案する。
stage-i では、表層柱空間を推定するために outlier-robust pca 法を用いる。
列空間を備えるstage-iiは、ラベルなしセンシングの最近の手法を適用し、置換されたデータを復元する。
UPCAの置換の上位に欠落するエントリが与えられると、ラベルなし行列完備化の問題が起こり、そこで同様のフレーバーの理論とアルゴリズムが導かれる。
合成データ、顔画像、教育および医療記録の実験は、データ民営化やレコードリンクのような応用のためのアルゴリズムの可能性を明らかにする。
関連論文リスト
- Synergistic eigenanalysis of covariance and Hessian matrices for
enhanced binary classification [75.90957645766676]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
我々のアプローチは、クラス間の平均距離を最大化し、クラス内の分散を最小化する能力を確立する形式的な証明によって裏付けられている。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - Weakly supervised covariance matrices alignment through Stiefel matrices
estimation for MEG applications [64.20396555814513]
本稿では,Mixing Model Stiefel Adaptation (MSA)と呼ばれる時系列データに対する新しいドメイン適応手法を提案する。
我々は、ドメイン間の等価な信号分散とペアの対応を確立することにより、ターゲット領域における豊富なラベルのないデータを利用して効果的な予測を行う。
MSAは、Cam-CANデータセットのMEG信号を用いて、タスクの変動を伴う脳年齢回帰の最近の手法より優れている。
論文 参考訳(メタデータ) (2024-01-24T19:04:49Z) - Spectral Entry-wise Matrix Estimation for Low-Rank Reinforcement
Learning [53.445068584013896]
低ランク構造を持つ強化学習(RL)における行列推定問題について検討した。
低ランク帯では、回収される行列は期待される腕の報酬を指定し、低ランクマルコフ決定プロセス(MDP)では、例えばMDPの遷移カーネルを特徴付ける。
簡単なスペクトルベースの行列推定手法は,行列の特異部分空間を効率よく復元し,ほぼ最小の入力誤差を示すことを示す。
論文 参考訳(メタデータ) (2023-10-10T17:06:41Z) - A Perceptron-based Fine Approximation Technique for Linear Separation [0.0]
本稿では,正あるいは負のラベル付きデータポイント間でセパレータ超平面を見つけることを目的とした,新しいオンライン学習手法を提案する。
人工ニューロンの重みとバイアスは、高次元空間の超平面と直接関連付けられる。
実験結果から,Perceptronアルゴリズムよりも効率がよいことが示された。
論文 参考訳(メタデータ) (2023-09-12T08:35:24Z) - Recovering Simultaneously Structured Data via Non-Convex Iteratively
Reweighted Least Squares [0.8702432681310401]
線形観測から多種多様低次元構造に固執するデータを復元する新しいアルゴリズムを提案する。
IRLS法は,低/複合状態の計測に好適であることを示す。
論文 参考訳(メタデータ) (2023-06-08T06:35:47Z) - Covariance matrix preparation for quantum principal component analysis [0.8258451067861933]
主成分分析 (PCA) はデータ解析における次元還元法である。
密度行列の対角化に基づくPCAの量子アルゴリズムが定式化されている。
本手法は分子基底状態データセットに対して数値的に実装する。
論文 参考訳(メタデータ) (2022-04-07T15:11:42Z) - Solving weakly supervised regression problem using low-rank manifold
regularization [77.34726150561087]
我々は弱い教師付き回帰問題を解く。
weakly"の下では、いくつかのトレーニングポイントではラベルが知られ、未知のものもあれば、無作為なノイズの存在やリソースの欠如などの理由によって不確かであることが分かっています。
数値的な節ではモンテカルロモデルを用いて提案手法を人工と実のデータセットに適用した。
論文 参考訳(メタデータ) (2021-04-13T23:21:01Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Semi-Supervised Learning with Meta-Gradient [123.26748223837802]
半教師付き学習における簡単なメタ学習アルゴリズムを提案する。
その結果,提案アルゴリズムは最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-07-08T08:48:56Z) - Robust Matrix Completion with Mixed Data Types [0.0]
我々は,データ型が混在する部分的なエントリを持つ構造的低ランク行列を復元する問題を考察する。
ほとんどのアプローチは、基礎となる分布は1つしかないと仮定し、低階の制約は、行列 Satten Norm によって正則化される。
本稿では, 並列化に適したアルゴリズムフレームワークとともに, 高い回復保証を有する計算可能な統計手法を提案し, 混合データ型に対する部分的に観測されたエントリを持つ低階行列を1ステップで復元する。
論文 参考訳(メタデータ) (2020-05-25T21:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。