論文の概要: Interpretable dimension reduction for compositional data
- arxiv url: http://arxiv.org/abs/2509.05563v1
- Date: Sat, 06 Sep 2025 02:16:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.581975
- Title: Interpretable dimension reduction for compositional data
- Title(参考訳): 合成データの解釈可能な次元削減
- Authors: Junyoung Park, Cheolwoo Park, Jeongyoun Ahn,
- Abstract要約: 高次元の合成データは、単純な制約と過剰な零点のため、ユニークな統計的問題を引き起こす。
本稿では、余分な変換とゼロな計算を避けるために、合成データの解釈可能な次元削減のための新しいフレームワークを提案する。
提案手法は, 3次プロットで可視化可能な高次元の単純体に直接写像することで, 演算を軟化することでアマルガメーションの概念を一般化する。
- 参考スコア(独自算出の注目度): 14.60927508571862
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-dimensional compositional data, such as those from human microbiome studies, pose unique statistical challenges due to the simplex constraint and excess zeros. While dimension reduction is indispensable for analyzing such data, conventional approaches often rely on log-ratio transformations that compromise interpretability and distort the data through ad hoc zero replacements. We introduce a novel framework for interpretable dimension reduction of compositional data that avoids extra transformations and zero imputations. Our approach generalizes the concept of amalgamation by softening its operation, mapping high-dimensional compositions directly to a lower-dimensional simplex, which can be visualized in ternary plots. The framework further provides joint visualization of the reduction matrix, enabling intuitive, at-a-glance interpretation. To achieve optimal reduction within our framework, we incorporate sufficient dimension reduction, which defines a new identifiable objective: the central compositional subspace. For estimation, we propose a compositional kernel dimension reduction (CKDR) method. The estimator is provably consistent, exhibits sparsity that reveals underlying amalgamation structures, and comes with an intrinsic predictive model for downstream analyses. Applications to real microbiome datasets demonstrate that our approach provides a powerful graphical exploration tool for uncovering meaningful biological patterns, opening a new pathway for analyzing high-dimensional compositional data.
- Abstract(参考訳): ヒトのマイクロバイオーム研究のような高次元の合成データは、単純な制約と過剰なゼロのため、ユニークな統計的課題を提起する。
次元の縮小はそのようなデータを分析するには不可欠であるが、従来の手法では、解釈可能性の妥協やアドホックゼロ置換によるデータの歪曲といった対数比変換に頼っていることが多い。
本稿では、余分な変換とゼロな計算を避けるために、合成データの解釈可能な次元削減のための新しいフレームワークを提案する。
提案手法は,3次プロットで可視化可能な,高次元の合成を低次元の単純体に直接マッピングすることにより,アマルガメーションの概念を一般化する。
フレームワークはさらに、リダクションマトリックスを共同で視覚化し、直感的、即席の解釈を可能にする。
フレームワーク内で最適な縮小を実現するために、我々は、新しい識別可能な目的である中央構成部分空間を定義した十分な次元削減を組み込んだ。
推定のために,コンポジションカーネル次元削減法 (CKDR) を提案する。
推定器は、確実に一貫したものであり、下降する解析のための本質的な予測モデルとともに、下降するアマルガメーション構造を示す空間性を示す。
実際のマイクロバイオームデータセットへの応用は,本手法が有意義な生物学的パターンを明らかにするための強力なグラフィカル探索ツールを提供し,高次元合成データ解析のための新たな経路を開くことを実証している。
関連論文リスト
- Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - CARE: Large Precision Matrix Estimation for Compositional Data [9.440956168571617]
合成精度行列の正確な仕様を導入し,その基礎となる行列に関連付ける。
この接続を利用して、スパース基底精度行列を推定する合成正規化推定法(CARE)を提案する。
筆者らの理論は, 同定と推定の間の興味深いトレードオフを明らかにし, 構成データ解析における次元性の祝福を強調する。
論文 参考訳(メタデータ) (2023-09-13T14:20:22Z) - Laplacian-based Cluster-Contractive t-SNE for High Dimensional Data
Visualization [20.43471678277403]
本稿では t-SNE に基づく新しいグラフベース次元削減手法 LaptSNE を提案する。
具体的には、LaptSNEはグラフラプラシアンの固有値情報を利用して、低次元埋め込みにおけるポテンシャルクラスタを縮小する。
ラプラシアン合成目的による最適化を考える際には、より広い関心を持つであろう勾配を解析的に計算する方法を示す。
論文 参考訳(メタデータ) (2022-07-25T14:10:24Z) - A Local Similarity-Preserving Framework for Nonlinear Dimensionality
Reduction with Neural Networks [56.068488417457935]
本稿では,Vec2vecという新しい局所非線形手法を提案する。
ニューラルネットワークを訓練するために、マトリックスの近傍類似度グラフを構築し、データポイントのコンテキストを定義します。
8つの実データセットにおけるデータ分類とクラスタリングの実験により、Vec2vecは統計仮説テストにおける古典的な次元削減法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-03-10T23:10:47Z) - Manifold Learning via Manifold Deflation [105.7418091051558]
次元削減法は、高次元データの可視化と解釈に有用な手段を提供する。
多くの一般的な手法は単純な2次元のマニフォールドでも劇的に失敗する。
本稿では,グローバルな構造を座標として組み込んだ,新しいインクリメンタルな空間推定器の埋め込み手法を提案する。
実験により,本アルゴリズムは実世界および合成データセットに新規で興味深い埋め込みを復元することを示した。
論文 参考訳(メタデータ) (2020-07-07T10:04:28Z) - Deep Dimension Reduction for Supervised Representation Learning [51.10448064423656]
本研究は,本質的な特徴を持つ学習表現の次元削減手法を提案する。
提案手法は, 十分次元還元法の非パラメトリック一般化である。
推定された深度非パラメトリック表現は、その余剰リスクが0に収束するという意味で一貫したものであることを示す。
論文 参考訳(メタデータ) (2020-06-10T14:47:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。