論文の概要: Archetypal Analysis++: Rethinking the Initialization Strategy
- arxiv url: http://arxiv.org/abs/2301.13748v4
- Date: Mon, 13 May 2024 14:06:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-15 01:51:46.866332
- Title: Archetypal Analysis++: Rethinking the Initialization Strategy
- Title(参考訳): Archetypal Analysis++:初期化戦略を再考
- Authors: Sebastian Mair, Jens Sjölund,
- Abstract要約: アーチティパル解析は凸性制約を持つ行列分解法である。
本稿では,アーキティパル解析の確率論的初期化戦略であるアーキティパル解析++ (AA++) を提案する。
AA++は、最も頻繁に使われるものを含め、ほぼ常にすべてのベースラインを上回ります。
- 参考スコア(独自算出の注目度): 2.2155023678014083
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Archetypal analysis is a matrix factorization method with convexity constraints. Due to local minima, a good initialization is essential, but frequently used initialization methods yield either sub-optimal starting points or are prone to get stuck in poor local minima. In this paper, we propose archetypal analysis++ (AA++), a probabilistic initialization strategy for archetypal analysis that sequentially samples points based on their influence on the objective function, similar to $k$-means++. In fact, we argue that $k$-means++ already approximates the proposed initialization method. Furthermore, we suggest to adapt an efficient Monte Carlo approximation of $k$-means++ to AA++. In an extensive empirical evaluation of 15 real-world data sets of varying sizes and dimensionalities and considering two pre-processing strategies, we show that AA++ almost always outperforms all baselines, including the most frequently used ones.
- Abstract(参考訳): アーチティパル解析は凸性制約を持つ行列分解法である。
局所ミニマのため、良い初期化は必須であるが、頻繁に使われる初期化法は、準最適開始点を得るか、または、貧弱な局所ミニマで立ち往生する傾向がある。
本稿では,Architypal Analysis++ (AA++)を提案する。Architypal Analysisの確率的初期化戦略は,$k$-means++のような目的関数に対する影響に基づいて点を逐次サンプリングする。
実際、$k$-means++はすでに提案された初期化メソッドを近似している。
さらに,AA++に$k$-means++の効率的なモンテカルロ近似を適用することを提案する。
異なるサイズと次元の15の実世界のデータセットの広範な評価と2つの前処理戦略を考慮すると、AA++は最も頻繁に使用されるものを含め、ほぼ常に全てのベースラインを上回ります。
関連論文リスト
- Optimization without Retraction on the Random Generalized Stiefel Manifold [9.301728976515255]
本稿では,B$のランダムな推定値にのみアクセスしながら,最適化問題を解く,安価な反復手法を提案する。
我々の方法はすべての反復において制約を強制するのではなく、予想で定義される一般化されたスティーフェル多様体上の臨界点に収束する反復を生成する。
論文 参考訳(メタデータ) (2024-05-02T19:55:30Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - SUnAA: Sparse Unmixing using Archetypal Analysis [62.997667081978825]
本稿では, 古細菌スパルス解析(SUnAA)を用いた新しい地質学的エラーマップ手法を提案する。
まず,古細菌スパース解析(SunAA)に基づく新しいモデルの設計を行う。
論文 参考訳(メタデータ) (2023-08-09T07:58:33Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - An Online Riemannian PCA for Stochastic Canonical Correlation Analysis [37.8212762083567]
投影行列の再パラメータ化を用いた正準相関解析(CCA)のための効率的なアルゴリズム(RSG+)を提案する。
本論文は,その特性の定式化と技術的解析に主眼を置いているが,本実験により,一般的なデータセットに対する経験的挙動が極めて有望であることが確認された。
論文 参考訳(メタデータ) (2021-06-08T23:38:29Z) - Recent Theoretical Advances in Non-Convex Optimization [56.88981258425256]
近年、深層ネットワークにおける非最適化アルゴリズムの解析やデータ問題への関心が高まっており、非最適化のための理論的最適化アルゴリズムの最近の結果の概要を概説する。
論文 参考訳(メタデータ) (2020-12-11T08:28:51Z) - Optimal 1-NN Prototypes for Pathological Geometries [13.70633147306388]
トレーニングデータセットのサイズを減らすためにプロトタイプ手法を使用することで、分類の計算コストを大幅に削減することができる。
与えられたデータセットの最適なプロトタイプを見つけることは困難であり、代わりにアルゴリズムが使われる。
本稿では, ほぼ最適な分類器のプロトタイプをこの設定で発見するアルゴリズムを提案し, 理論的結果を実証的に検証する。
論文 参考訳(メタデータ) (2020-10-31T10:15:08Z) - Optimistic search strategy: Change point detection for large-scale data
via adaptive logarithmic queries [1.3212010735248336]
変更点検出は、データセグメント化時の適合性の改善を記述したゲイン関数の最大値の探索として、しばしば定式化される。
我々は、ゲイン関数の特定の構造を利用した楽観的な探索戦略を$O(log T)$で提案する。
論文 参考訳(メタデータ) (2020-10-20T11:09:52Z) - Scalable Initialization Methods for Large-Scale Clustering [0.0]
K平均クラスタリングのための2つの新しい手法を提案する。
提案手法はスケーラブルであり、並列で実行できる。
実験の結果,提案手法は最先端技術と良好に比較できることがわかった。
論文 参考訳(メタデータ) (2020-07-23T11:29:53Z) - Debiasing Distributed Second Order Optimization with Surrogate Sketching
and Scaled Regularization [101.5159744660701]
分散第2次最適化において、標準的な戦略は、データの小さなスケッチやバッチに基づいて、多くの局所的な見積もりを平均化することである。
本稿では,分散二階法における収束率の理論的および実証的改善を両立させるため,局所的な推定を嫌悪する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-02T18:08:14Z) - Is Temporal Difference Learning Optimal? An Instance-Dependent Analysis [102.29671176698373]
我々は、割引決定過程における政策評価の問題に対処し、生成モデルの下で、ll_infty$errorに対するマルコフに依存した保証を提供する。
我々は、ポリシー評価のために、局所ミニマックス下限の両漸近バージョンと非漸近バージョンを確立し、アルゴリズムを比較するためのインスタンス依存ベースラインを提供する。
論文 参考訳(メタデータ) (2020-03-16T17:15:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。