論文の概要: Beyond Explained Variance: A Cautionary Tale of PCA
- arxiv url: http://arxiv.org/abs/2605.13520v2
- Date: Sun, 17 May 2026 13:40:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:45.893267
- Title: Beyond Explained Variance: A Cautionary Tale of PCA
- Title(参考訳): 説明変数を超えて:PCAの注意点
- Authors: Gionni Marchetti,
- Abstract要約: 本稿では,単位円から一様にデータをサンプリングする生成確率幾何学モデルを提案する。
このモデルの下では、ペアワイズコサイン距離は観測されたU字分布と定性的に一致するアルコシン分布に従い、t-SNEと永続ホモロジーに基づく解析を独立に支持する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address shortcomings of principal component analysis (PCA) for visualizing high-dimensional data lying on a nonlinear low-dimensional manifold via two-dimensional scatterplots, focusing on a fossil teeth dataset from the early mammalian insectivore Kuehneotherium. While the PCA scatterplot reported by Jolliffe and Cadima (Philosophical Transactions of the Royal Society A, 2016) shows clustering in the region where PC2 < 0, our analysis based on t-SNE and persistent homology (PH) reveals a ring-like structure with no evident clustering and intrinsic dimensionality equal to one. We further propose a generative probabilistic-geometric model in which the data are sampled uniformly from a unit circle. Under this model, pairwise cosine distances follow an arcsine distribution, in qualitative agreement with the observed U-shaped distribution, thereby independently supporting the analysis based on t-SNE and persistent homology.
- Abstract(参考訳): 本研究は,2次元散乱体を用いて非線型低次元多様体上に横たわる高次元データを可視化するための主成分分析(PCA)の欠点に対処するものである。
The PCA scatterplot reported by Jolliffe and Cadima (Philosophical Transactions of the Royal Society A, 2016) shows clustering in the region where PC2 < 0, our analysis based t-SNE and persistent homology (PH) shows a ring-like structure with no obvious clustering and intrinsic dimensionality equal to one。
さらに,単位円からデータを均一にサンプリングする生成確率幾何モデルを提案する。
このモデルの下では、ペアワイズコサイン距離は観測されたU字分布と定性的に一致するアルコシン分布に従い、t-SNEと永続ホモロジーに基づく解析を独立に支持する。
関連論文リスト
- Measuring and Decomposing Mode Separation via the Canonical Diffusion [0.0]
モード分離は密度の基本的な幾何学的性質であり、高次元での定量化が難しい。
密度に固有の1つのプロセスを通してモード分離を測定する。
i)合成ガウス混合物,(ii)SDXLテキスト・トゥ・イメージ世代,(ii)SSAとDAがエントロピーとPCAミスを捉えた構造,(iii)アラニンジペプチドの分子動力学,(iii)DAは静的サンプルから既知の遅いバックボーンを回収する。
論文 参考訳(メタデータ) (2026-05-09T08:05:55Z) - Curvature-Aware PCA with Geodesic Tangent Space Aggregation for Semi-Supervised Learning [52.452902154360565]
GTSA-PCAは主成分分析の幾何学的拡張である。
曲率認識と測地的整合性を統合されたスペクトルフレームワークに統合する。
以上の結果から,GTSA-PCAは次元減少に対する統計的および幾何学的アプローチの原則的ブリッジとして位置づけられた。
論文 参考訳(メタデータ) (2026-04-20T20:36:36Z) - Quotient-Based Posterior Analysis for Euclidean Latent Space Models [0.5371337604556311]
ユークリッド潜在空間モデルに対する商ベース後部解析を提案する。
一つの埋め込みを超越した潜在関係構造が,コヒーレントな後続解析によって明らかにされることを示す。
論文 参考訳(メタデータ) (2026-04-03T05:21:10Z) - Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - Joint Bayesian Inference of Graphical Structure and Parameters with a
Single Generative Flow Network [59.79008107609297]
本稿では,ベイジアンネットワークの構造上の結合後部を近似する手法を提案する。
サンプリングポリシが2フェーズプロセスに従う単一のGFlowNetを使用します。
パラメータは後部分布に含まれるため、これは局所確率モデルに対してより柔軟である。
論文 参考訳(メタデータ) (2023-05-30T19:16:44Z) - Wasserstein Archetypal Analysis [9.54262011088777]
Archetypal Analysisは、凸ポリトープを用いてデータを要約する教師なし機械学習手法である。
We consider a alternative formulation of archetypal analysis based on the Wasserstein metric。
論文 参考訳(メタデータ) (2022-10-25T19:50:09Z) - Locality of Spontaneous Symmetry Breaking and Universal Spacing
Distribution of Topological Defects Formed Across a Phase Transition [62.997667081978825]
連続相転移は、KZM(Kybble-Zurek mechanism)によって予測される密度を伴う位相欠陥の形成をもたらす。
結果の非平衡状態における点状位相欠陥の空間分布を特徴付けるとともに、任意の空間次元のポアソン点過程をKZM密度でモデル化する。
論文 参考訳(メタデータ) (2022-02-23T19:00:06Z) - Consistency of archetypal analysis [10.424626933990272]
Archetypal Analysisは、凸多面体を用いて多変量データを要約する教師なし学習手法である。
本稿では,そのデータが有界サポートを持つ確率測度から独立にサンプリングされているかどうかを示す一貫性の証明を行う。
また, 最適目標値の収束率を, 分布の適切な仮定で求める。
論文 参考訳(メタデータ) (2020-10-16T04:07:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。