論文の概要: Reproducing Kernels and New Approaches in Compositional Data Analysis
- arxiv url: http://arxiv.org/abs/2205.01158v1
- Date: Mon, 2 May 2022 18:46:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-04 13:40:39.634756
- Title: Reproducing Kernels and New Approaches in Compositional Data Analysis
- Title(参考訳): 合成データ解析における再生カーネルと新しいアプローチ
- Authors: Binglin Li and Jeongyoun Ahn
- Abstract要約: 人間の腸内マイクロバイオームのような構成データを分析するには、データの形状を慎重に扱う必要がある。
本研究では、合成データが本質的に射影的であるというキーとなる観察に基づいて、構成領域を群作用によって外される球の商位相として再解釈する。
この構成データのためのRKHSの構築は、今後の方法論開発のために広く研究の道を開くだろう。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Compositional data, such as human gut microbiomes, consist of non-negative
variables whose only the relative values to other variables are available.
Analyzing compositional data such as human gut microbiomes needs a careful
treatment of the geometry of the data. A common geometrical understanding of
compositional data is via a regular simplex. Majority of existing approaches
rely on a log-ratio or power transformations to overcome the innate simplicial
geometry. In this work, based on the key observation that a compositional data
are projective in nature, and on the intrinsic connection between projective
and spherical geometry, we re-interpret the compositional domain as the
quotient topology of a sphere modded out by a group action. This
re-interpretation allows us to understand the function space on compositional
domains in terms of that on spheres and to use spherical harmonics theory along
with reflection group actions for constructing a compositional Reproducing
Kernel Hilbert Space (RKHS). This construction of RKHS for compositional data
will widely open research avenues for future methodology developments. In
particular, well-developed kernel embedding methods can be now introduced to
compositional data analysis. The polynomial nature of compositional RKHS has
both theoretical and computational benefits. The wide applicability of the
proposed theoretical framework is exemplified with nonparametric density
estimation and kernel exponential family for compositional data.
- Abstract(参考訳): ヒト腸内マイクロバイオームのような構成データは、他の変数に対する相対値のみが利用できる非負の変数からなる。
人間の腸内マイクロバイオームなどの合成データを分析するには、データの形状を慎重に扱う必要がある。
構成データの一般的な幾何学的理解は、正則単純体を通してである。
既存のアプローチの大多数は、生来の単純幾何を克服するために対数比や電力変換に依存している。
本研究では、合成データが自然界において射影的であること、および射影幾何学と球面幾何学の本質的な関係に基づいて、構成領域を群作用によって変調された球面の商位相として再解釈する。
この再解釈により、球面上での合成領域上の函数空間を理解し、球面調和理論と、合成再生ケルネルヒルベルト空間(RKHS)を構成する反射群作用を利用することができる。
この構成データのためのRKHSの構築は、今後の方法論開発のために広く研究の道を開くだろう。
特に、よく開発されたカーネル埋め込みメソッドが合成データ解析に導入できるようになった。
合成 rkhs の多項式の性質は理論的にも計算的にも有益である。
提案する理論フレームワークの広範な適用性は,非パラメトリック密度推定と,合成データに対するカーネル指数族を用いて実証される。
関連論文リスト
- Score-based pullback Riemannian geometry [10.649159213723106]
本稿では,データ駆動型リーマン幾何学のフレームワークを提案する。
データサポートを通して高品質な測地学を作成し、データ多様体の固有次元を確実に推定する。
我々のフレームワークは、訓練中に等方性正規化を採用することで、自然に異方性正規化フローで使用することができる。
論文 参考訳(メタデータ) (2024-10-02T18:52:12Z) - (Deep) Generative Geodesics [57.635187092922976]
2つのデータポイント間の類似性を評価するために,新しい測定基準を導入する。
我々の計量は、生成距離と生成測地学の概念的定義に繋がる。
彼らの近似は、穏やかな条件下で真の値に収束することが証明されている。
論文 参考訳(メタデータ) (2024-07-15T21:14:02Z) - Improving embedding of graphs with missing data by soft manifolds [51.425411400683565]
グラフ埋め込みの信頼性は、連続空間の幾何がグラフ構造とどの程度一致しているかに依存する。
我々は、この問題を解決することができる、ソフト多様体と呼ばれる新しい多様体のクラスを導入する。
グラフ埋め込みにソフト多様体を用いることで、複雑なデータセット上のデータ解析における任意のタスクを追求するための連続空間を提供できる。
論文 参考訳(メタデータ) (2023-11-29T12:48:33Z) - CARE: Large Precision Matrix Estimation for Compositional Data [9.440956168571617]
合成精度行列の正確な仕様を導入し,その基礎となる行列に関連付ける。
この接続を利用して、スパース基底精度行列を推定する合成正規化推定法(CARE)を提案する。
筆者らの理論は, 同定と推定の間の興味深いトレードオフを明らかにし, 構成データ解析における次元性の祝福を強調する。
論文 参考訳(メタデータ) (2023-09-13T14:20:22Z) - A Heat Diffusion Perspective on Geodesic Preserving Dimensionality
Reduction [66.21060114843202]
熱測地線埋め込みと呼ばれるより一般的な熱カーネルベースの多様体埋め込み法を提案する。
その結果,本手法は,地中真理多様体距離の保存において,既存の技術よりも優れていることがわかった。
また,連続体とクラスタ構造を併用した単一セルRNAシークエンシングデータセットに本手法を適用した。
論文 参考訳(メタデータ) (2023-05-30T13:58:50Z) - Parametrizing Product Shape Manifolds by Composite Networks [5.772786223242281]
形状空間に対する効率的なニューラルネットワーク近似を特別な積構造で学習することは可能であることを示す。
提案アーキテクチャは,低次元因子の近似とその後の組み合わせを別々に学習することで,この構造を利用する。
論文 参考訳(メタデータ) (2023-02-28T15:31:23Z) - Study of Manifold Geometry using Multiscale Non-Negative Kernel Graphs [32.40622753355266]
データの幾何学的構造を研究するための枠組みを提案する。
我々は最近導入された非負のカーネル回帰グラフを用いて、点密度、固有次元、およびデータ多様体(曲率)の線型性を推定する。
論文 参考訳(メタデータ) (2022-10-31T17:01:17Z) - Time-inhomogeneous diffusion geometry and topology [69.55228523791897]
拡散凝縮(英: Diffusion condensation)は、各ステップが最初に計算し、そのデータに拡散演算子を適用する時間不均質な過程である。
我々はこの過程の収束と進化を幾何学的、スペクトル的、位相的観点から理論的に分析する。
我々の研究は拡散凝縮の収束に関する理論的洞察を与え、トポロジカルデータ解析と幾何学的データ解析のリンクを提供することを示している。
論文 参考訳(メタデータ) (2022-03-28T16:06:17Z) - Clustered Federated Learning via Generalized Total Variation
Minimization [83.26141667853057]
本研究では,分散ネットワーク構造を持つローカルデータセットの局所的(あるいはパーソナライズされた)モデルを学習するための最適化手法について検討する。
我々の主要な概念的貢献は、総変動最小化(GTV)としてフェデレーション学習を定式化することである。
私たちのアルゴリズムの主な貢献は、完全に分散化されたフェデレーション学習アルゴリズムです。
論文 参考訳(メタデータ) (2021-05-26T18:07:19Z) - A Unifying and Canonical Description of Measure-Preserving Diffusions [60.59592461429012]
ユークリッド空間における測度保存拡散の完全なレシピは、最近、いくつかのMCMCアルゴリズムを単一のフレームワークに統合した。
我々は、この構成を任意の多様体に改善し一般化する幾何学理論を開発する。
論文 参考訳(メタデータ) (2021-05-06T17:36:55Z) - A Sheaf and Topology Approach to Generating Local Branch Numbers in
Digital Images [9.645196221785694]
本稿では、トポロジカルデータ解析(TDA)とせん断理論を組み合わせた理論的アプローチについて述べる。
シーフ理論は幾何学的対象の局所的な一貫性を記述するための枠組みを提供する。
提案手法は,デジタル画像中の局所物体の分岐数を同定するために適用可能であることを示す。
論文 参考訳(メタデータ) (2020-11-27T06:50:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。