論文の概要: Personalized PCA: Decoupling Shared and Unique Features
- arxiv url: http://arxiv.org/abs/2207.08041v2
- Date: Thu, 8 Feb 2024 17:35:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 20:11:42.666549
- Title: Personalized PCA: Decoupling Shared and Unique Features
- Title(参考訳): パーソナライズされたPCA:共有機能とユニークな機能の分離
- Authors: Naichen Shi and Raed Al Kontar
- Abstract要約: 異種データセットから共有特徴とユニークな特徴を分離するパーソナライズされたPCA(PerPCA)を提案する。
穏やかな条件下では、一意的特徴と共有的特徴の両方を制約付き最適化問題によって識別し、復元できることが示される。
異種データセットから共有とユニークな機能を分離するための体系的なアプローチとして、PerPCAは、ビデオセグメンテーション、トピック抽出、フィーチャークラスタリングなど、いくつかのタスクにおけるアプリケーションを見つける。
- 参考スコア(独自算出の注目度): 4.976703689624386
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we tackle a significant challenge in PCA: heterogeneity. When
data are collected from different sources with heterogeneous trends while still
sharing some congruency, it is critical to extract shared knowledge while
retaining the unique features of each source. To this end, we propose
personalized PCA (PerPCA), which uses mutually orthogonal global and local
principal components to encode both unique and shared features. We show that,
under mild conditions, both unique and shared features can be identified and
recovered by a constrained optimization problem, even if the covariance
matrices are immensely different. Also, we design a fully federated algorithm
inspired by distributed Stiefel gradient descent to solve the problem. The
algorithm introduces a new group of operations called generalized retractions
to handle orthogonality constraints, and only requires global PCs to be shared
across sources. We prove the linear convergence of the algorithm under suitable
assumptions. Comprehensive numerical experiments highlight PerPCA's superior
performance in feature extraction and prediction from heterogeneous datasets.
As a systematic approach to decouple shared and unique features from
heterogeneous datasets, PerPCA finds applications in several tasks, including
video segmentation, topic extraction, and feature clustering.
- Abstract(参考訳): 本稿では,PCAにおける重要な課題である不均一性に取り組む。
異質な傾向を持つ異なるソースからデータを収集し,一貫性を保ちながら収集する場合,各ソースの特徴を保ちながら共有知識を抽出することが重要である。
そこで本研究では,相互直交グローバルおよび局所主成分を用いたパーソナライズPCA(PerPCA)を提案する。
穏やかな条件下では,共分散行列が著しく異なる場合でも,一意的特徴と共有特徴の両方を制約付き最適化問題によって同定し,復元できることを示す。
また,分散Stiefel勾配勾配から着想を得た完全フェデレーションアルゴリズムを設計し,この問題を解決する。
このアルゴリズムは直交性の制約を扱うために一般化された引き算と呼ばれる新しい演算群を導入し、ソース間で共有するグローバルpcのみを必要とする。
適切な仮定の下でアルゴリズムの線形収束を証明する。
総合的な数値実験は、不均一なデータセットからの特徴抽出と予測におけるPerPCAの優れた性能を強調している。
異種データセットから共有とユニークな機能を分離するための体系的なアプローチとして、PerPCAはビデオセグメンテーション、トピック抽出、フィーチャークラスタリングなど、いくつかのタスクでアプリケーションを見つける。
関連論文リスト
- Sparse outlier-robust PCA for multi-source data [2.3226893628361687]
そこで本研究では,重要な特徴と局所的なソース固有パターンを同時に選択する新しいPCA手法を提案する。
我々は,グローバルな局所構造的空間パターンに対応するペナルティを持つ正規化問題を開発する。
本稿では,乗算器の交互方向法による提案手法の効率的な実装について述べる。
論文 参考訳(メタデータ) (2024-07-23T08:55:03Z) - Gram-Schmidt Methods for Unsupervised Feature Extraction and Selection [7.373617024876725]
本稿では,関数空間上のGram-Schmidtプロセスを提案する。
合成および実世界のベンチマークデータセットに対する実験結果を提供する。
驚いたことに、線形特徴抽出アルゴリズムは同等であり、しばしば重要な非線形特徴抽出法よりも優れている。
論文 参考訳(メタデータ) (2023-11-15T21:29:57Z) - Differentially Private Federated Clustering over Non-IID Data [59.611244450530315]
クラスタリングクラスタ(FedC)問題は、巨大なクライアント上に分散されたラベルなしデータサンプルを、サーバのオーケストレーションの下で有限のクライアントに正確に分割することを目的としている。
本稿では,DP-Fedと呼ばれる差分プライバシー収束手法を用いた新しいFedCアルゴリズムを提案する。
提案するDP-Fedの様々な属性は、プライバシー保護の理論的解析、特に非識別的かつ独立に分散された(非i.d.)データの場合において得られる。
論文 参考訳(メタデータ) (2023-01-03T05:38:43Z) - Sparse PCA With Multiple Components [2.5382095320488673]
スパース主成分分析(SPCA)は、高次元データセットの分散を解釈可能な方法で説明する特徴の組み合わせを得る技術である。
既存のPCA手法の多くは、複数のスパースPCを求めるときの最適性だけでなく、結果の最適性も保証していない。
本稿では,実世界のデータセットに対して,0%-15%の精度で解を得るための厳密な手法と丸め機構を提案する。
論文 参考訳(メタデータ) (2022-09-29T13:57:18Z) - Feature Selection via the Intervened Interpolative Decomposition and its
Application in Diversifying Quantitative Strategies [4.913248451323163]
本稿では,観測行列の各列がそれぞれの優先度や重要性を持つ補間分解(ID)を計算するための確率論的モデルを提案する。
提案したモデルを,中国A株10株を含む実世界のデータセット上で評価した。
論文 参考訳(メタデータ) (2022-09-29T03:36:56Z) - Federated Offline Reinforcement Learning [55.326673977320574]
マルチサイトマルコフ決定プロセスモデルを提案する。
我々は,オフラインRLを対象とした最初のフェデレーション最適化アルゴリズムを設計する。
提案アルゴリズムでは,学習ポリシーの準最適性は,データが分散していないような速度に匹敵する,理論的保証を与える。
論文 参考訳(メタデータ) (2022-06-11T18:03:26Z) - A Linearly Convergent Algorithm for Distributed Principal Component
Analysis [12.91948651812873]
本稿では,1時間スケール分散pcaアルゴリズムである分散sanger's algorithm(dsa)を提案する。
提案アルゴリズムは真の解の近傍に線形収束することを示した。
論文 参考訳(メタデータ) (2021-01-05T00:51:14Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z) - Repulsive Mixture Models of Exponential Family PCA for Clustering [127.90219303669006]
指数関数型家族主成分分析(EPCA)の混合拡張は、従来のEPCAよりもデータ分布に関する構造情報を符号化するように設計された。
従来のEPCAの混合は、モデルの冗長性、すなわち混合成分間の重なりが問題であり、データクラスタリングの曖昧さを引き起こす可能性がある。
本稿では, 混合成分間での反発性増感前処理を導入し, ベイズ式に分散EPCA混合(DEPCAM)モデルを開発した。
論文 参考訳(メタデータ) (2020-04-07T04:07:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。