論文の概要: Wasserstein Projection Pursuit of Non-Gaussian Signals
- arxiv url: http://arxiv.org/abs/2302.12693v1
- Date: Fri, 24 Feb 2023 15:36:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-27 13:09:37.905097
- Title: Wasserstein Projection Pursuit of Non-Gaussian Signals
- Title(参考訳): 非ガウス信号のwasserstein射影追跡
- Authors: Satyaki Mukherjee, Soumendu Sundar Mukherjee, Debarghya Ghoshdastidar
- Abstract要約: 我々は、高次元データクラウドにおける興味深い特徴の$k$次元非ガウス部分空間における興味深い方向を見つけるという問題を考察する。
生成モデルの下では、この未知の部分空間を近似する精度について厳密な統計的保証を証明している。
我々の結果は,データ次元がサンプルサイズに匹敵する体制で機能する。
- 参考スコア(独自算出の注目度): 8.789656856095947
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We consider the general dimensionality reduction problem of locating in a
high-dimensional data cloud, a $k$-dimensional non-Gaussian subspace of
interesting features. We use a projection pursuit approach -- we search for
mutually orthogonal unit directions which maximise the 2-Wasserstein distance
of the empirical distribution of data-projections along these directions from a
standard Gaussian. Under a generative model, where there is a underlying
(unknown) low-dimensional non-Gaussian subspace, we prove rigorous statistical
guarantees on the accuracy of approximating this unknown subspace by the
directions found by our projection pursuit approach. Our results operate in the
regime where the data dimensionality is comparable to the sample size, and thus
supplement the recent literature on the non-feasibility of locating interesting
directions via projection pursuit in the complementary regime where the data
dimensionality is much larger than the sample size.
- Abstract(参考訳): 高次元データクラウド(k$-dimensional non-gaussian subspace of interesting features)における一般次元縮小問題を考える。
我々は、標準ガウスからこれらの方向に沿ったデータ射影の実験的分布の2-ワッサーシュタイン距離を最大化する、相互直交単位方向を求める射影探索手法を用いる。
基礎となる(知られていない)低次元の非ガウス部分空間が存在する生成モデルの下では、この未知の部分空間を射影追跡アプローチによって得られた方向によって近似する精度に関する厳密な統計的保証が証明される。
本研究は,データ次元がサンプルサイズに匹敵する状態にあり,データ次元がサンプルサイズよりもはるかに大きい相補的な状態において,投射追尾による興味深い方向の配置が不可能である最近の文献を補完するものである。
関連論文リスト
- Expected Information Gain Estimation via Density Approximations: Sample Allocation and Dimension Reduction [0.40964539027092906]
一般非線形/非ガウス的設定におけるEIG推定のためのフレキシブルトランスポートに基づくスキームを定式化する。
この最適サンプル割り当てにより、得られたEIG推定器のMSEは標準ネストされたモンテカルロスキームよりも高速に収束することを示す。
次に、パラメータを投影し、低次元部分空間に観測することで失われる相互情報の勾配に基づく上界を導出することにより、高次元でのEIGの推定に対処する。
論文 参考訳(メタデータ) (2024-11-13T07:22:50Z) - On Probabilistic Pullback Metrics on Latent Hyperbolic Manifolds [5.724027955589408]
本稿では,階層関係のモデル化に適した双曲多様体について述べる。
本稿では,VM の非線形写像によって生じる歪みを考慮に入れたプルバックメトリックによる双曲的計量の増大を提案する。
様々な実験を通して、引き戻し距離の測地学は双曲ラテント空間の幾何学を尊重するだけでなく、基礎となるデータ分布と整合することを示した。
論文 参考訳(メタデータ) (2024-10-28T09:13:00Z) - Uncertainty Visualization via Low-Dimensional Posterior Projections [23.371244861123827]
低次元部分空間上のエネルギーベースモデル(EBM)を用いて後部を推定・可視化するための新しいアプローチを提案する。
提案手法の有効性を,多様なデータセットと画像復元問題にまたがって示す。
論文 参考訳(メタデータ) (2023-12-12T23:51:07Z) - Implicit Manifold Gaussian Process Regression [49.0787777751317]
ガウス過程の回帰は、よく校正された不確実性推定を提供するために広く用いられている。
これは、データが実際に存在する暗黙の低次元多様体のため、高次元データに苦しむ。
本稿では,データ(ラベル付きおよびラベルなし)から直接暗黙構造を完全に微分可能な方法で推定できる手法を提案する。
論文 参考訳(メタデータ) (2023-10-30T09:52:48Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Laplacian-based Cluster-Contractive t-SNE for High Dimensional Data
Visualization [20.43471678277403]
本稿では t-SNE に基づく新しいグラフベース次元削減手法 LaptSNE を提案する。
具体的には、LaptSNEはグラフラプラシアンの固有値情報を利用して、低次元埋め込みにおけるポテンシャルクラスタを縮小する。
ラプラシアン合成目的による最適化を考える際には、より広い関心を持つであろう勾配を解析的に計算する方法を示す。
論文 参考訳(メタデータ) (2022-07-25T14:10:24Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Fast Approximation of the Sliced-Wasserstein Distance Using
Concentration of Random Projections [19.987683989865708]
Sliced-Wasserstein distance (SW) は、機械学習アプリケーションでますます使われている。
本稿では,測度現象の集中を利用してSWを近似する新しい視点を提案する。
提案手法は多数のランダムなプロジェクションをサンプリングする必要はなく,通常のモンテカルロ近似と比較して正確かつ容易に利用できる。
論文 参考訳(メタデータ) (2021-06-29T13:56:19Z) - Instance-Optimal Compressed Sensing via Posterior Sampling [101.43899352984774]
後部サンプリング推定器がほぼ最適回復保証を達成できることを示す。
本稿では,Langevin dynamics を用いた深部生成前駆体の後方サンプリング推定器を実装し,MAP よりも精度の高い推定値が得られることを実証的に見出した。
論文 参考訳(メタデータ) (2021-06-21T22:51:56Z) - Augmented Sliced Wasserstein Distances [55.028065567756066]
拡張スライスされたワッサーシュタイン距離(ASWD)と呼ばれる新しい距離測定法を提案する。
ASWDは、ニューラルネットワークによってパラメータ化された高次元超曲面への最初のマッピングサンプルによって構成される。
数値的な結果から、ASWDは、合成問題と実世界の問題の両方において、他のワッサーシュタイン変種を著しく上回っていることが示されている。
論文 参考訳(メタデータ) (2020-06-15T23:00:08Z) - Two-Dimensional Semi-Nonnegative Matrix Factorization for Clustering [50.43424130281065]
TS-NMFと呼ばれる2次元(2次元)データに対する新しい半負行列分解法を提案する。
前処理ステップで2次元データをベクトルに変換することで、データの空間情報に深刻なダメージを与える既存の手法の欠点を克服する。
論文 参考訳(メタデータ) (2020-05-19T05:54:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。