論文の概要: Wasserstein Archetypal Analysis
- arxiv url: http://arxiv.org/abs/2210.14298v1
- Date: Tue, 25 Oct 2022 19:50:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 13:46:09.360666
- Title: Wasserstein Archetypal Analysis
- Title(参考訳): Wasserstein Archetypal Analysis
- Authors: Katy Craig, Braxton Osting, Dong Wang, and Yiming Xu
- Abstract要約: Archetypal Analysisは、凸ポリトープを用いてデータを要約する教師なし機械学習手法である。
We consider a alternative formulation of archetypal analysis based on the Wasserstein metric。
- 参考スコア(独自算出の注目度): 9.54262011088777
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Archetypal analysis is an unsupervised machine learning method that
summarizes data using a convex polytope. In its original formulation, for fixed
k, the method finds a convex polytope with k vertices, called archetype points,
such that the polytope is contained in the convex hull of the data and the mean
squared Euclidean distance between the data and the polytope is minimal.
In the present work, we consider an alternative formulation of archetypal
analysis based on the Wasserstein metric, which we call Wasserstein archetypal
analysis (WAA). In one dimension, there exists a unique solution of WAA and, in
two dimensions, we prove existence of a solution, as long as the data
distribution is absolutely continuous with respect to Lebesgue measure. We
discuss obstacles to extending our result to higher dimensions and general data
distributions. We then introduce an appropriate regularization of the problem,
via a Renyi entropy, which allows us to obtain existence of solutions of the
regularized problem for general data distributions, in arbitrary dimensions. We
prove a consistency result for the regularized problem, ensuring that if the
data are iid samples from a probability measure, then as the number of samples
is increased, a subsequence of the archetype points converges to the archetype
points for the limiting data distribution, almost surely. Finally, we develop
and implement a gradient-based computational approach for the two-dimensional
problem, based on the semi-discrete formulation of the Wasserstein metric. Our
analysis is supported by detailed computational experiments.
- Abstract(参考訳): Archetypal Analysisは、凸ポリトープを用いてデータを要約する教師なし機械学習手法である。
元の定式化では、固定 k に対して、データの凸包にポリトープが含まれ、データとポリトープの間の平均2乗ユークリッド距離が最小となるような、アーチタイプ点と呼ばれる k 個の頂点を持つ凸ポリトープを求める。
本稿では,wasserstein archetypal analysis(wasserstein archetypal analysis,waa)と呼ばれる,wasserstein計量に基づくアーチ型解析の代替定式化について検討する。
1次元では、WAAのユニークな解が存在し、2次元では、データ分布がルベーグ測度に関して絶対連続である限り、解の存在を証明します。
我々は、結果をより高い次元と一般的なデータ分布に拡張する障害について論じる。
次に,一般データ分布に対する正規化問題の解の存在を任意の次元で得るためのrenyiエントロピーを用いて,問題の適切な正則化を導入する。
正規化問題に対する一貫性を証明し、データが確率測度からiidサンプルである場合、サンプル数が増加すると、アーチタイプ点のサブシーケンスが制限データ分布のアーチタイプ点にほぼ確実に収束することを保証する。
最後に,ワッサースタイン計量の半離散的定式化に基づく2次元問題に対する勾配に基づく計算手法を開発し,実装する。
我々の分析は詳細な計算実験によって支えられている。
関連論文リスト
- Wasserstein Bounds for generative diffusion models with Gaussian tail targets [0.0]
本稿では,データ分布とスコアベース生成モデルの生成の間のワッサースタイン距離を推定する。
次元で有界な複雑性は、対数定数を持つ$O(sqrtd)$である。
論文 参考訳(メタデータ) (2024-12-15T17:20:42Z) - Extracting Manifold Information from Point Clouds [0.0]
カーネルベースの手法は$mathbbRd$のサブセットのシグネチャ関数を構成するために提案される。
点雲の解析と解析が主な応用である。
論文 参考訳(メタデータ) (2024-03-30T17:21:07Z) - Randomized Physics-Informed Machine Learning for Uncertainty
Quantification in High-Dimensional Inverse Problems [49.1574468325115]
本研究では,高次元逆問題における不確実性定量化のための物理インフォームド機械学習手法を提案する。
我々は解析的に、そして、ハミルトン・モンテカルロとの比較を通して、rPICKLE はベイズ則によって与えられる真の後続に収束することを示す。
論文 参考訳(メタデータ) (2023-12-11T07:33:16Z) - Approximating a RUM from Distributions on k-Slates [88.32814292632675]
与えられた分布を平均で最もよく近似するRUMを求める一般化時間アルゴリズムを求める。
我々の理論的結果は、実世界のデータセットに効果的でスケール可能なものを得るという、実践的な結果も得られます。
論文 参考訳(メタデータ) (2023-05-22T17:43:34Z) - Nonlinear Sufficient Dimension Reduction for
Distribution-on-Distribution Regression [9.086237593805173]
本稿では,予測値と応答値の両方が分布データである場合に,非線形に十分な次元を減少させる新しい手法を提案する。
我々の重要なステップは、計量空間上に普遍カーネル(cc-ユニバーサル)を構築することである。
論文 参考訳(メタデータ) (2022-07-11T04:11:36Z) - Local versions of sum-of-norms clustering [77.34726150561087]
本手法はボールモデルにおいて任意に閉じた球を分離できることを示す。
我々は、不連結連結集合のクラスタリングで発生する誤差に定量的な有界性を証明した。
論文 参考訳(メタデータ) (2021-09-20T14:45:29Z) - Probabilistic methods for approximate archetypal analysis [8.829245587252435]
Archetypal analysisは、探索データ分析のための教師なし学習手法である。
データの次元と表現の基数を低減するために,2つの前処理手法を導入する。
提案手法を応用して, 適度に大規模なデータセットを要約することで, 結果の有用性を実証する。
論文 参考訳(メタデータ) (2021-08-12T14:27:11Z) - Improving Metric Dimensionality Reduction with Distributed Topology [68.8204255655161]
DIPOLEは、局所的、計量的項と大域的、位相的項の両方で損失関数を最小化し、初期埋め込みを補正する次元推論後処理ステップである。
DIPOLEは、UMAP、t-SNE、Isomapといった一般的な手法よりも多くの一般的なデータセットで優れています。
論文 参考訳(メタデータ) (2021-06-14T17:19:44Z) - Continuous Wasserstein-2 Barycenter Estimation without Minimax
Optimization [94.18714844247766]
ワッサーシュタイン・バリセンターは、最適輸送に基づく確率測度の重み付き平均の幾何学的概念を提供する。
本稿では,Wasserstein-2 バリセンタのサンプルアクセスを演算するスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-02T21:01:13Z) - Optimal oracle inequalities for solving projected fixed-point equations [53.31620399640334]
ヒルベルト空間の既知の低次元部分空間を探索することにより、確率観測の集合を用いて近似解を計算する手法を検討する。
本稿では,線形関数近似を用いた政策評価問題に対する時間差分学習手法の誤差を正確に評価する方法について述べる。
論文 参考訳(メタデータ) (2020-12-09T20:19:32Z) - Consistency of archetypal analysis [10.424626933990272]
Archetypal Analysisは、凸多面体を用いて多変量データを要約する教師なし学習手法である。
本稿では,そのデータが有界サポートを持つ確率測度から独立にサンプリングされているかどうかを示す一貫性の証明を行う。
また, 最適目標値の収束率を, 分布の適切な仮定で求める。
論文 参考訳(メタデータ) (2020-10-16T04:07:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。