論文の概要: An Approach to Variable Clustering: K-means in Transposed Data and its Relationship with Principal Component Analysis
- arxiv url: http://arxiv.org/abs/2512.00979v1
- Date: Sun, 30 Nov 2025 16:53:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.526157
- Title: An Approach to Variable Clustering: K-means in Transposed Data and its Relationship with Principal Component Analysis
- Title(参考訳): 可変クラスタリングへのアプローチ:変換データのK平均と主成分分析との関係
- Authors: Victor Saquicela, Kenneth Palacio-Baus, Mario Chifla,
- Abstract要約: 主成分分析とK-平均は多変量解析の基本的な技術である。
そこで本研究では,K平均値を用いて得られた変数のクラスタ間の関係を解析する手法を提案する。
次に、各変数クラスタの主成分へのコントリビューションを、変数のロードに基づいて定量化する。
- 参考スコア(独自算出の注目度): 0.7646713951724009
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Principal Component Analysis (PCA) and K-means constitute fundamental techniques in multivariate analysis. Although they are frequently applied independently or sequentially to cluster observations, the relationship between them, especially when K-means is used to cluster variables rather than observations, has been scarcely explored. This study seeks to address this gap by proposing an innovative method that analyzes the relationship between clusters of variables obtained by applying K-means on transposed data and the principal components of PCA. Our approach involves applying PCA to the original data and K-means to the transposed data set, where the original variables are converted into observations. The contribution of each variable cluster to each principal component is then quantified using measures based on variable loadings. This process provides a tool to explore and understand the clustering of variables and how such clusters contribute to the principal dimensions of variation identified by PCA.
- Abstract(参考訳): 主成分分析(PCA)とK平均は多変量解析の基本的な技術である。
クラスター観測には独立あるいは逐次的に適用されることが多いが、これらの関係、特にK平均が観測よりもクラスター変数に使用される場合、ほとんど調査されていない。
そこで本研究では, K-means を用いて得られた変数のクラスタと PCA の主成分の関係を解析し, このギャップを解消する手法を提案する。
提案手法では,PCAを元のデータに適用し,K平均を変換したデータセットに適用し,元の変数を観測に変換する。
次に、各変数クラスタの主成分へのコントリビューションを、変数のロードに基づいて定量化する。
このプロセスは、変数のクラスタリングと、そのようなクラスタがPCAによって識別される変動の主次元にどのように貢献するかを探索し理解するツールを提供する。
関連論文リスト
- Clustering Approaches for Mixed-Type Data: A Comparative Study [0.0]
混在型データのクラスタリングは、このタスクに適合するアプローチがほとんどないため、課題である。
本研究は,これらの手法の現状を考察し,様々なシミュレーションモデルを用いて比較する。
KAMILA, LCM, k-prototypes は, 調整型ランドインデックス (ARI) に関して, 最高の性能を示した。
論文 参考訳(メタデータ) (2025-11-24T22:18:23Z) - Efficient Covariance Estimation for Sparsified Functional Data [51.69796254617083]
共分散関数のランダムノット(ランダムノット-空間)とB-スプライン(Bspline-Spatial)推定器は計算的に効率的である。
共分散の漸近的なポイントワイドは、ある規則性条件下でのスパース化された個々の軌跡に対して得られる。
論文 参考訳(メタデータ) (2025-11-23T00:50:33Z) - One-shot Robust Federated Learning of Independent Component Analysis [16.462282750354408]
そこで我々は,$k$-meansクラスタリングを利用して局所的クライアント推定における置換あいまいさを解消する幾何的中央値に基づく集約アルゴリズムを提案する。
提案手法は,まず,クライアントが提供する推定器をクラスタに分割し,次に幾何学的中央値を用いて各クラスタ内の推定器を集約するk-meansを実行する。
論文 参考訳(メタデータ) (2025-05-26T21:37:19Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.38518232934096]
マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。
本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。
両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文 参考訳(メタデータ) (2024-06-12T08:30:16Z) - A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - Co-clustering based exploratory analysis of mixed-type data tables [0.0]
本稿では,2段階の手法に基づく混合データクラスタリング手法を提案する。
最初のステップでは、すべての変数は、アナリストが選択した多数のビンに従って双項化されます。
第2のステップでは、インスタンスとバイナリ変数をクラスタリングして、インスタンスのグループと変数部分のグループを生成します。
論文 参考訳(メタデータ) (2022-12-22T14:23:50Z) - Simple and Scalable Algorithms for Cluster-Aware Precision Medicine [0.0]
共同クラスタリングと埋め込みに対するシンプルでスケーラブルなアプローチを提案する。
この新しいクラスタ対応の埋め込みアプローチは、現在の共同埋め込みとクラスタリング法の複雑さと限界を克服する。
当社のアプローチでは,ユーザが希望するクラスタ数を選択する必要はなく,階層的にクラスタ化された埋め込みの解釈可能なデンドログラムを生成する。
論文 参考訳(メタデータ) (2022-11-29T19:27:26Z) - Algorithm-Agnostic Interpretations for Clustering [0.0]
縮小次元におけるクラスタリング結果を説明するために,アルゴリズムに依存しない解釈法を提案する。
クラスタリングにおける置換機能の重要性は、特徴値のシャッフルに基づく一般的なフレームワークを表している。
すべてのメソッドは、任意のクラスタリングアルゴリズムを使って、ソフトラベルやハードラベルを通じてインスタンスを再割り当てすることができる。
論文 参考訳(メタデータ) (2022-09-21T18:08:40Z) - Eigen Analysis of Self-Attention and its Reconstruction from Partial
Computation [58.80806716024701]
ドット積に基づく自己注意を用いて計算した注意点のグローバルな構造について検討する。
注意点の変動の大部分は低次元固有空間にあることがわかった。
トークンペアの部分的な部分集合に対してのみスコアを計算し、それを用いて残りのペアのスコアを推定する。
論文 参考訳(メタデータ) (2021-06-16T14:38:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。