論文の概要: Probabilistic methods for approximate archetypal analysis
- arxiv url: http://arxiv.org/abs/2108.05767v2
- Date: Mon, 16 Aug 2021 14:15:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 10:50:10.758424
- Title: Probabilistic methods for approximate archetypal analysis
- Title(参考訳): 近似アーチ型解析のための確率論的手法
- Authors: Ruijian Han, Braxton Osting, Dong Wang, Yiming Xu
- Abstract要約: Archetypal analysisは、探索データ分析のための教師なし学習手法である。
データの次元と表現の基数を低減するために,2つの前処理手法を導入する。
提案手法を応用して, 適度に大規模なデータセットを要約することで, 結果の有用性を実証する。
- 参考スコア(独自算出の注目度): 8.829245587252435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Archetypal analysis is an unsupervised learning method for exploratory data
analysis. One major challenge that limits the applicability of archetypal
analysis in practice is the inherent computational complexity of the existing
algorithms. In this paper, we provide a novel approximation approach to
partially address this issue. Utilizing probabilistic ideas from
high-dimensional geometry, we introduce two preprocessing techniques to reduce
the dimension and representation cardinality of the data, respectively. We
prove that, provided the data is approximately embedded in a low-dimensional
linear subspace and the convex hull of the corresponding representations is
well approximated by a polytope with a few vertices, our method can effectively
reduce the scaling of archetypal analysis. Moreover, the solution of the
reduced problem is near-optimal in terms of prediction errors. Our approach can
be combined with other acceleration techniques to further mitigate the
intrinsic complexity of archetypal analysis. We demonstrate the usefulness of
our results by applying our method to summarize several moderately large-scale
datasets.
- Abstract(参考訳): Archetypal Analysisは探索データ分析のための教師なし学習手法である。
アーキティパル解析の適用性を制限する大きな課題の1つは、既存のアルゴリズム固有の計算複雑性である。
本稿では,この問題を部分的に解決するための新しい近似手法を提案する。
確率的アイデアを高次元幾何から利用して,データの次元と表現の濃度をそれぞれ減少させる2つの前処理手法を導入する。
低次元の線型部分空間におおむね埋め込まれており、対応する表現の凸包がいくつかの頂点を持つポリトープによってよく近似されている場合、本手法はアーチ型解析のスケーリングを効果的に低減できることを示す。
さらに、還元問題の解は予測誤差の点でほぼ最適である。
本手法は他の加速度法と組み合わせることで,根本的解析の複雑さをさらに軽減することができる。
本手法を適度な大規模データセットの要約に応用し,本手法の有用性を示す。
関連論文リスト
- Efficient Fairness-Performance Pareto Front Computation [51.558848491038916]
最適公正表現はいくつかの有用な構造特性を持つことを示す。
そこで,これらの近似問題は,凹凸プログラミング法により効率的に解けることを示す。
論文 参考訳(メタデータ) (2024-09-26T08:46:48Z) - Mixed Matrix Completion in Complex Survey Sampling under Heterogeneous
Missingness [6.278498348219109]
サブ線形収束を実現する高速でスケーラブルな推定アルゴリズムを提案する。
本手法は,全国保健栄養検査調査データの分析に応用される。
論文 参考訳(メタデータ) (2024-02-06T12:26:58Z) - Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-10-08T23:39:38Z) - Linearization Algorithms for Fully Composite Optimization [61.20539085730636]
本稿では,完全合成最適化問題を凸コンパクト集合で解くための一階アルゴリズムについて検討する。
微分可能および非微分可能を別々に扱い、滑らかな部分のみを線形化することで目的の構造を利用する。
論文 参考訳(メタデータ) (2023-02-24T18:41:48Z) - Entropic Descent Archetypal Analysis for Blind Hyperspectral Unmixing [45.82374977939355]
我々は、ブラインド・ハイパースペクトル・アンミックスのためのアーチティパル解析に基づく新しいアルゴリズムを提案する。
6つの標準実データセットを用いて、我々の手法は最先端の行列分解や最近のディープラーニング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-09-22T13:34:21Z) - On Riemannian Approach for Constrained Optimization Model in Extreme
Classification Problems [2.7436792484073638]
制約付き最適化問題は行列多様体上の最適化問題として定式化される。
提案手法は,複数の実世界の大規模マルチラベルデータセットで検証される。
論文 参考訳(メタデータ) (2021-09-30T11:28:35Z) - Analysis of Truncated Orthogonal Iteration for Sparse Eigenvector
Problems [78.95866278697777]
本研究では,多元的固有ベクトルを分散制約で同時に計算するTruncated Orthogonal Iterationの2つの変種を提案する。
次に,我々のアルゴリズムを適用して,幅広いテストデータセットに対するスパース原理成分分析問題を解く。
論文 参考訳(メタデータ) (2021-03-24T23:11:32Z) - A Forward Backward Greedy approach for Sparse Multiscale Learning [0.0]
本稿では,カーネルが重み付きマルチスケール構造を持つRKHS(Reproduction Kernel Hilbert space)を提案する。
この空間における近似を生成するために、多スケール構造を持つ基底関数の集合をゆるやかに構成できる実用的なフォワードバックワードアルゴリズムを提供する。
我々は,様々なシミュレーションと実データ集合を用いて,アプローチの性能を解析する。
論文 参考訳(メタデータ) (2021-02-14T04:22:52Z) - Optimal oracle inequalities for solving projected fixed-point equations [53.31620399640334]
ヒルベルト空間の既知の低次元部分空間を探索することにより、確率観測の集合を用いて近似解を計算する手法を検討する。
本稿では,線形関数近似を用いた政策評価問題に対する時間差分学習手法の誤差を正確に評価する方法について述べる。
論文 参考訳(メタデータ) (2020-12-09T20:19:32Z) - Convex Geometry and Duality of Over-parameterized Neural Networks [70.15611146583068]
有限幅2層ReLUネットワークの解析のための凸解析手法を開発した。
正規化学習問題に対する最適解が凸集合の極点として特徴づけられることを示す。
高次元では、トレーニング問題は無限に多くの制約を持つ有限次元凸問題としてキャストできることが示される。
論文 参考訳(メタデータ) (2020-02-25T23:05:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。