論文の概要: Unlabeled Principal Component Analysis
- arxiv url: http://arxiv.org/abs/2101.09446v1
- Date: Sat, 23 Jan 2021 07:34:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-19 10:51:06.637620
- Title: Unlabeled Principal Component Analysis
- Title(参考訳): ラベルなし主成分分析
- Authors: Yunzhen Yao, Liangzu Peng and Manolis C. Tsakiris
- Abstract要約: 本稿では,各列のエントリが未知の置換を受けるデータ行列からの主成分分析の問題点について考察する。
方程式の置換不変系は最小限に多くの解を持ち、各解は基底構造データ行列の行置換に対応する。
そこで本研究では,データのほんの一部しか置換されていない場合に適したupcaのための2段階のアルゴリズムパイプラインを提案する。
- 参考スコア(独自算出の注目度): 22.39080447156474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of principal component analysis from a data matrix
where the entries of each column have undergone some unknown permutation,
termed Unlabeled Principal Component Analysis (UPCA). Using algebraic geometry,
we establish that for generic enough data, and up to a permutation of the
coordinates of the ambient space, there is a unique subspace of minimal
dimension that explains the data. We show that a permutation-invariant system
of polynomial equations has finitely many solutions, with each solution
corresponding to a row permutation of the ground-truth data matrix. Allowing
for missing entries on top of permutations leads to the problem of unlabeled
matrix completion, for which we give theoretical results of similar flavor. We
also propose a two-stage algorithmic pipeline for UPCA suitable for the
practically relevant case where only a fraction of the data has been permuted.
Stage-I of this pipeline employs robust-PCA methods to estimate the
ground-truth column-space. Equipped with the column-space, stage-II applies
methods for linear regression without correspondences to restore the permuted
data. A computational study reveals encouraging findings, including the ability
of UPCA to handle face images from the Extended Yale-B database with
arbitrarily permuted patches of arbitrary size in $0.3$ seconds on a standard
desktop computer.
- Abstract(参考訳): 我々は、各列のエントリが未知の置換(unlabeled principal component analysis (upca) と呼ばれる)を受けるデータ行列から主成分分析の問題を考える。
代数幾何学を用いて、十分一般的なデータと、周囲の空間の座標の置換について、データを説明する極小次元の一意な部分空間が存在することを立証する。
多項式方程式の置換不変系は有限個の解を持ち、各解は基底トラスデータ行列の行置換に対応する。
置換点上に欠落するエントリが与えられると、ラベルなし行列完備化の問題が起こり、同様のフレーバーの理論的結果が得られる。
また,データのほんの一部しか置換されていない場合に適したupcaのための2段階のアルゴリズムパイプラインを提案する。
このパイプラインのステージiはロバスト-pca法を用いて地上列空間を推定する。
列空間を具備したステージIIでは、順列データを復元するための対応のない線形回帰法を適用している。
計算研究では、UPCAが標準的なデスクトップコンピュータで任意のサイズの任意のサイズのパッチを0.3ドル秒で任意に置換した拡張Yale-Bデータベースから顔画像を処理する機能を含む、奨励的な発見を明らかにしている。
関連論文リスト
- Synergistic eigenanalysis of covariance and Hessian matrices for
enhanced binary classification [75.90957645766676]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
我々のアプローチは、クラス間の平均距離を最大化し、クラス内の分散を最小化する能力を確立する形式的な証明によって裏付けられている。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - Weakly supervised covariance matrices alignment through Stiefel matrices
estimation for MEG applications [64.20396555814513]
本稿では,Mixing Model Stiefel Adaptation (MSA)と呼ばれる時系列データに対する新しいドメイン適応手法を提案する。
我々は、ドメイン間の等価な信号分散とペアの対応を確立することにより、ターゲット領域における豊富なラベルのないデータを利用して効果的な予測を行う。
MSAは、Cam-CANデータセットのMEG信号を用いて、タスクの変動を伴う脳年齢回帰の最近の手法より優れている。
論文 参考訳(メタデータ) (2024-01-24T19:04:49Z) - Spectral Entry-wise Matrix Estimation for Low-Rank Reinforcement
Learning [53.445068584013896]
低ランク構造を持つ強化学習(RL)における行列推定問題について検討した。
低ランク帯では、回収される行列は期待される腕の報酬を指定し、低ランクマルコフ決定プロセス(MDP)では、例えばMDPの遷移カーネルを特徴付ける。
簡単なスペクトルベースの行列推定手法は,行列の特異部分空間を効率よく復元し,ほぼ最小の入力誤差を示すことを示す。
論文 参考訳(メタデータ) (2023-10-10T17:06:41Z) - A Perceptron-based Fine Approximation Technique for Linear Separation [0.0]
本稿では,正あるいは負のラベル付きデータポイント間でセパレータ超平面を見つけることを目的とした,新しいオンライン学習手法を提案する。
人工ニューロンの重みとバイアスは、高次元空間の超平面と直接関連付けられる。
実験結果から,Perceptronアルゴリズムよりも効率がよいことが示された。
論文 参考訳(メタデータ) (2023-09-12T08:35:24Z) - Recovering Simultaneously Structured Data via Non-Convex Iteratively
Reweighted Least Squares [0.8702432681310401]
線形観測から多種多様低次元構造に固執するデータを復元する新しいアルゴリズムを提案する。
IRLS法は,低/複合状態の計測に好適であることを示す。
論文 参考訳(メタデータ) (2023-06-08T06:35:47Z) - Covariance matrix preparation for quantum principal component analysis [0.8258451067861933]
主成分分析 (PCA) はデータ解析における次元還元法である。
密度行列の対角化に基づくPCAの量子アルゴリズムが定式化されている。
本手法は分子基底状態データセットに対して数値的に実装する。
論文 参考訳(メタデータ) (2022-04-07T15:11:42Z) - Solving weakly supervised regression problem using low-rank manifold
regularization [77.34726150561087]
我々は弱い教師付き回帰問題を解く。
weakly"の下では、いくつかのトレーニングポイントではラベルが知られ、未知のものもあれば、無作為なノイズの存在やリソースの欠如などの理由によって不確かであることが分かっています。
数値的な節ではモンテカルロモデルを用いて提案手法を人工と実のデータセットに適用した。
論文 参考訳(メタデータ) (2021-04-13T23:21:01Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Semi-Supervised Learning with Meta-Gradient [123.26748223837802]
半教師付き学習における簡単なメタ学習アルゴリズムを提案する。
その結果,提案アルゴリズムは最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-07-08T08:48:56Z) - Robust Matrix Completion with Mixed Data Types [0.0]
我々は,データ型が混在する部分的なエントリを持つ構造的低ランク行列を復元する問題を考察する。
ほとんどのアプローチは、基礎となる分布は1つしかないと仮定し、低階の制約は、行列 Satten Norm によって正則化される。
本稿では, 並列化に適したアルゴリズムフレームワークとともに, 高い回復保証を有する計算可能な統計手法を提案し, 混合データ型に対する部分的に観測されたエントリを持つ低階行列を1ステップで復元する。
論文 参考訳(メタデータ) (2020-05-25T21:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。