論文の概要: Fair Streaming Principal Component Analysis: Statistical and Algorithmic
Viewpoint
- arxiv url: http://arxiv.org/abs/2310.18593v1
- Date: Sat, 28 Oct 2023 05:09:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 17:43:04.427470
- Title: Fair Streaming Principal Component Analysis: Statistical and Algorithmic
Viewpoint
- Title(参考訳): フェアストリーミングの主成分分析:統計的・アルゴリズム的視点
- Authors: Junghyun Lee, Hanseul Cho, Se-Young Yun, Chulhee Yun
- Abstract要約: 本稿では, ほぼ公平かつ最適(PAFO)学習性という新しい概念を用いて, 公正主成分分析(PCA)に対する理論的, 実践的なアプローチを提案する。
次に、PAFO学習性の観点から統計学的保証を行い、PCA文学におけるこの種の文献としては初めてである。
最後に,実世界のデータセット上でのアルゴリズムの有効性とメモリ効率を検証する。
- 参考スコア(独自算出の注目度): 38.86637435197192
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fair Principal Component Analysis (PCA) is a problem setting where we aim to
perform PCA while making the resulting representation fair in that the
projected distributions, conditional on the sensitive attributes, match one
another. However, existing approaches to fair PCA have two main problems:
theoretically, there has been no statistical foundation of fair PCA in terms of
learnability; practically, limited memory prevents us from using existing
approaches, as they explicitly rely on full access to the entire data. On the
theoretical side, we rigorously formulate fair PCA using a new notion called
\emph{probably approximately fair and optimal} (PAFO) learnability. On the
practical side, motivated by recent advances in streaming algorithms for
addressing memory limitation, we propose a new setting called \emph{fair
streaming PCA} along with a memory-efficient algorithm, fair noisy power method
(FNPM). We then provide its {\it statistical} guarantee in terms of
PAFO-learnability, which is the first of its kind in fair PCA literature.
Lastly, we verify the efficacy and memory efficiency of our algorithm on
real-world datasets.
- Abstract(参考訳): フェア・プリンシパル・コンポーネント・アナリシス (fair principal component analysis, pca) は、pcaを実行し、その結果の表現を公平にすることを目的とした問題設定である。
理論的には、学習性の観点からは、公正なPCAの統計的基盤は存在せず、実際、メモリの制限により、データ全体への完全なアクセスに明示的に依存しているため、既存のアプローチを利用できない。
理論的な面では、fair pca は \emph{probably almost fair and optimal} (pafo) 学習可能性と呼ばれる新しい概念を用いて厳密に定式化される。
実用面では,近年のメモリ制限に対処するストリーミングアルゴリズムの進歩により,メモリ効率の高いアルゴリズムであるフェアノイズパワー法(FNPM)とともに,'emph{fair streaming PCA} と呼ばれる新しい設定を提案する。
すると、pafo-learnabilityという観点でその {\it statistical} の保証が与えられ、これは公正なpca文献において最初のものである。
最後に,実世界のデータセット上でのアルゴリズムの有効性とメモリ効率を検証する。
関連論文リスト
- Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - Fair principal component analysis (PCA): minorization-maximization
algorithms for Fair PCA, Fair Robust PCA and Fair Sparse PCA [6.974999794070285]
公平なPCA(FPCA)問題を解決するために,新しい反復アルゴリズムを提案する。
提案アルゴリズムはアルゴリズムの反復ごとに厳密であることが証明された半直交制約の緩和に依存する。
本稿では,提案手法の性能を,合成データセットと実生活データセットの2つの最先端手法と比較する。
論文 参考訳(メタデータ) (2023-05-10T08:14:32Z) - Efficient fair PCA for fair representation learning [21.990310743597174]
そこで本研究では,標準的なPCAに類似した解析解をカーネル化可能な,概念的にシンプルなアプローチを提案する。
提案手法は,標準PCAやカーネルPCAと同じ複雑さを持ち,半定値プログラミングや多様体最適化に基づく等価PCAの既存手法よりもはるかに高速に動作する。
論文 参考訳(メタデータ) (2023-02-26T13:34:43Z) - An online algorithm for contrastive Principal Component Analysis [9.090031210111919]
我々は、cPCA*のオンラインアルゴリズムを導き、局所的な学習規則でニューラルネットワークにマップできることを示し、エネルギー効率の良いニューロモルフィックハードウェアで実装できる可能性がある。
実際のデータセット上でのオンラインアルゴリズムの性能を評価し、元の定式化との相違点と類似点を強調した。
論文 参考訳(メタデータ) (2022-11-14T19:48:48Z) - Practical Approaches for Fair Learning with Multitype and Multivariate
Sensitive Attributes [70.6326967720747]
現実世界に展開された機械学習アルゴリズムが不公平さや意図しない社会的結果をもたらすことはないことを保証することが重要である。
本稿では,カーネルHilbert Spacesの相互共分散演算子上に構築されたフェアネス尺度であるFairCOCCOを紹介する。
実世界のデータセットにおける予測能力と公正性のバランスをとる上で、最先端技術に対する一貫した改善を実証的に示す。
論文 参考訳(メタデータ) (2022-11-11T11:28:46Z) - A novel approach for Fair Principal Component Analysis based on
eigendecomposition [10.203602318836444]
1次元探索からなる簡単な戦略を用いて,公平性問題に対処する新しいPCAアルゴリズムを提案する。
私たちの発見は、いくつかの現実の状況と、バランスの取れていないデータセットとバランスの取れていないデータセットの両方のシナリオで一致しています。
論文 参考訳(メタデータ) (2022-08-24T08:20:16Z) - Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision Processes [99.26864533035454]
半可観測マルコフ決定過程におけるオフライン強化学習(RL)について検討する。
本稿では,UnderlineProxy変数 underlinePessimistic UnderlinePolicy UnderlineOptimization (textttP3O)アルゴリズムを提案する。
textttP3Oは、確立されたデータセットを持つPOMDPのための証明可能な最初のオフラインRLアルゴリズムである。
論文 参考訳(メタデータ) (2022-05-26T19:13:55Z) - FAST-PCA: A Fast and Exact Algorithm for Distributed Principal Component
Analysis [12.91948651812873]
主成分分析(PCA)は、機械学習の世界における基本的なデータ前処理ツールである。
本稿では,FAST-PCA (Fast and exact distributed PCA) と呼ばれる分散PCAアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-08-27T16:10:59Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z) - Approximation Algorithms for Sparse Principal Component Analysis [57.5357874512594]
主成分分析(PCA)は、機械学習と統計学において広く使われている次元削減手法である。
スパース主成分分析(Sparse principal Component Analysis)と呼ばれる,スパース主成分負荷を求める様々な手法が提案されている。
本研究では,SPCA問題に対するしきい値の精度,時間,近似アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-23T04:25:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。