論文の概要: Consistency of archetypal analysis
- arxiv url: http://arxiv.org/abs/2010.08148v2
- Date: Mon, 19 Oct 2020 14:11:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 21:59:53.202786
- Title: Consistency of archetypal analysis
- Title(参考訳): 原型分析の一貫性
- Authors: Braxton Osting, Dong Wang, Yiming Xu and Dominique Zosso
- Abstract要約: Archetypal Analysisは、凸多面体を用いて多変量データを要約する教師なし学習手法である。
本稿では,そのデータが有界サポートを持つ確率測度から独立にサンプリングされているかどうかを示す一貫性の証明を行う。
また, 最適目標値の収束率を, 分布の適切な仮定で求める。
- 参考スコア(独自算出の注目度): 10.424626933990272
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Archetypal analysis is an unsupervised learning method that uses a convex
polytope to summarize multivariate data. For fixed $k$, the method finds a
convex polytope with $k$ vertices, called archetype points, such that the
polytope is contained in the convex hull of the data and the mean squared
distance between the data and the polytope is minimal. In this paper, we prove
a consistency result that shows if the data is independently sampled from a
probability measure with bounded support, then the archetype points converge to
a solution of the continuum version of the problem, of which we identify and
establish several properties. We also obtain the convergence rate of the
optimal objective values under appropriate assumptions on the distribution. If
the data is independently sampled from a distribution with unbounded support,
we also prove a consistency result for a modified method that penalizes the
dispersion of the archetype points. Our analysis is supported by detailed
computational experiments of the archetype points for data sampled from the
uniform distribution in a disk, the normal distribution, an annular
distribution, and a Gaussian mixture model.
- Abstract(参考訳): Archetypal Analysisは、凸多面体を用いて多変量データを要約する教師なし学習手法である。
固定$k$の場合、この手法は、データの凸殻にポリトープが含まれ、データとポリトープの間の平均2乗距離が最小となるような、アーチタイプポイントと呼ばれる、$k$の頂点を持つ凸ポリトープを見つける。
本稿では,データが有界支持を持つ確率測度から独立にサンプリングされているかどうかを示す一貫性を証明し,その場合,アーキタイプ点が問題の連続バージョン解に収束し,いくつかの特性を特定し,確立する。
また,分布上の適切な仮定の下での最適目的値の収束率を求める。
もしデータが非有界な支持を持つ分布から独立にサンプリングされた場合、アーチタイプ点の分散をペナライズする修正方法の一貫性結果も証明する。
本解析は,ディスク内の一様分布,正規分布,環状分布,ガウス混合モデルからサンプリングしたデータに対するアーチタイプ点の詳細な計算実験によって支援されている。
関連論文リスト
- Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Empirical Density Estimation based on Spline Quasi-Interpolation with
applications to Copulas clustering modeling [0.0]
密度推定は、様々な分野において、基礎となるデータの分布をモデル化し理解するための基礎的な手法である。
本稿では,擬似補間による密度の単変量近似を提案する。
提案アルゴリズムは人工データセットと実データセットで検証される。
論文 参考訳(メタデータ) (2024-02-18T11:49:38Z) - Classification of Heavy-tailed Features in High Dimensions: a
Superstatistical Approach [1.4469725791865984]
我々は2つのデータポイントの雲と一般的なセントロイドの混合の学習を特徴付ける。
得られた推定器の一般化性能について検討し、正規化の役割を解析し、分離性遷移を解析した。
論文 参考訳(メタデータ) (2023-04-06T07:53:05Z) - Mean-Square Analysis of Discretized It\^o Diffusions for Heavy-tailed
Sampling [17.415391025051434]
重み付きポインカーの不等式に関連する伊藤拡散の自然クラスを離散化することにより、重み付き分布のクラスからのサンプリングの複雑さを分析する。
平均二乗解析に基づいて、ワッサーシュタイン2計量のターゲット分布に近い分布が$epsilon$のサンプルを得るための反復複雑性を確立する。
論文 参考訳(メタデータ) (2023-03-01T15:16:03Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Data thinning for convolution-closed distributions [2.299914829977005]
本稿では,観測を2つ以上の独立した部分に分割する手法であるデータ薄型化を提案する。
教師なし学習手法の結果の検証には,データの薄化が有効であることを示す。
論文 参考訳(メタデータ) (2023-01-18T02:47:41Z) - Wasserstein Archetypal Analysis [9.54262011088777]
Archetypal Analysisは、凸ポリトープを用いてデータを要約する教師なし機械学習手法である。
We consider a alternative formulation of archetypal analysis based on the Wasserstein metric。
論文 参考訳(メタデータ) (2022-10-25T19:50:09Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Local versions of sum-of-norms clustering [77.34726150561087]
本手法はボールモデルにおいて任意に閉じた球を分離できることを示す。
我々は、不連結連結集合のクラスタリングで発生する誤差に定量的な有界性を証明した。
論文 参考訳(メタデータ) (2021-09-20T14:45:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。