論文の概要: Consistency of archetypal analysis
- arxiv url: http://arxiv.org/abs/2010.08148v2
- Date: Mon, 19 Oct 2020 14:11:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 21:59:53.202786
- Title: Consistency of archetypal analysis
- Title(参考訳): 原型分析の一貫性
- Authors: Braxton Osting, Dong Wang, Yiming Xu and Dominique Zosso
- Abstract要約: Archetypal Analysisは、凸多面体を用いて多変量データを要約する教師なし学習手法である。
本稿では,そのデータが有界サポートを持つ確率測度から独立にサンプリングされているかどうかを示す一貫性の証明を行う。
また, 最適目標値の収束率を, 分布の適切な仮定で求める。
- 参考スコア(独自算出の注目度): 10.424626933990272
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Archetypal analysis is an unsupervised learning method that uses a convex
polytope to summarize multivariate data. For fixed $k$, the method finds a
convex polytope with $k$ vertices, called archetype points, such that the
polytope is contained in the convex hull of the data and the mean squared
distance between the data and the polytope is minimal. In this paper, we prove
a consistency result that shows if the data is independently sampled from a
probability measure with bounded support, then the archetype points converge to
a solution of the continuum version of the problem, of which we identify and
establish several properties. We also obtain the convergence rate of the
optimal objective values under appropriate assumptions on the distribution. If
the data is independently sampled from a distribution with unbounded support,
we also prove a consistency result for a modified method that penalizes the
dispersion of the archetype points. Our analysis is supported by detailed
computational experiments of the archetype points for data sampled from the
uniform distribution in a disk, the normal distribution, an annular
distribution, and a Gaussian mixture model.
- Abstract(参考訳): Archetypal Analysisは、凸多面体を用いて多変量データを要約する教師なし学習手法である。
固定$k$の場合、この手法は、データの凸殻にポリトープが含まれ、データとポリトープの間の平均2乗距離が最小となるような、アーチタイプポイントと呼ばれる、$k$の頂点を持つ凸ポリトープを見つける。
本稿では,データが有界支持を持つ確率測度から独立にサンプリングされているかどうかを示す一貫性を証明し,その場合,アーキタイプ点が問題の連続バージョン解に収束し,いくつかの特性を特定し,確立する。
また,分布上の適切な仮定の下での最適目的値の収束率を求める。
もしデータが非有界な支持を持つ分布から独立にサンプリングされた場合、アーチタイプ点の分散をペナライズする修正方法の一貫性結果も証明する。
本解析は,ディスク内の一様分布,正規分布,環状分布,ガウス混合モデルからサンプリングしたデータに対するアーチタイプ点の詳細な計算実験によって支援されている。
関連論文リスト
- Empirical Density Estimation based on Spline Quasi-Interpolation with
applications to Copulas clustering modeling [0.0]
密度推定は、様々な分野において、基礎となるデータの分布をモデル化し理解するための基礎的な手法である。
本稿では,擬似補間による密度の単変量近似を提案する。
提案アルゴリズムは人工データセットと実データセットで検証される。
論文 参考訳(メタデータ) (2024-02-18T11:49:38Z) - Distributed Markov Chain Monte Carlo Sampling based on the Alternating
Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。
我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。
シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文 参考訳(メタデータ) (2024-01-29T02:08:40Z) - Sampling and estimation on manifolds using the Langevin diffusion [48.898189211250234]
離散化マルコフ過程に基づく$mu_phi $の線形汎函数の2つの推定器を検討する。
誤差境界は、本質的に定義されたランゲヴィン拡散の離散化を用いてサンプリングと推定のために導出される。
論文 参考訳(メタデータ) (2023-12-22T18:01:11Z) - Approximating a RUM from Distributions on k-Slates [88.32814292632675]
与えられた分布を平均で最もよく近似するRUMを求める一般化時間アルゴリズムを求める。
我々の理論的結果は、実世界のデータセットに効果的でスケール可能なものを得るという、実践的な結果も得られます。
論文 参考訳(メタデータ) (2023-05-22T17:43:34Z) - Classification of Heavy-tailed Features in High Dimensions: a
Superstatistical Approach [1.4469725791865984]
我々は2つのデータポイントの雲と一般的なセントロイドの混合の学習を特徴付ける。
得られた推定器の一般化性能について検討し、正規化の役割を解析し、分離性遷移を解析した。
論文 参考訳(メタデータ) (2023-04-06T07:53:05Z) - Mean-Square Analysis of Discretized It\^o Diffusions for Heavy-tailed
Sampling [17.415391025051434]
重み付きポインカーの不等式に関連する伊藤拡散の自然クラスを離散化することにより、重み付き分布のクラスからのサンプリングの複雑さを分析する。
平均二乗解析に基づいて、ワッサーシュタイン2計量のターゲット分布に近い分布が$epsilon$のサンプルを得るための反復複雑性を確立する。
論文 参考訳(メタデータ) (2023-03-01T15:16:03Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Data thinning for convolution-closed distributions [2.299914829977005]
本稿では,観測を2つ以上の独立した部分に分割する手法であるデータ薄型化を提案する。
教師なし学習手法の結果の検証には,データの薄化が有効であることを示す。
論文 参考訳(メタデータ) (2023-01-18T02:47:41Z) - Wasserstein Archetypal Analysis [9.54262011088777]
Archetypal Analysisは、凸ポリトープを用いてデータを要約する教師なし機械学習手法である。
We consider a alternative formulation of archetypal analysis based on the Wasserstein metric。
論文 参考訳(メタデータ) (2022-10-25T19:50:09Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Local versions of sum-of-norms clustering [77.34726150561087]
本手法はボールモデルにおいて任意に閉じた球を分離できることを示す。
我々は、不連結連結集合のクラスタリングで発生する誤差に定量的な有界性を証明した。
論文 参考訳(メタデータ) (2021-09-20T14:45:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。