論文の概要: Stable Sparse Subspace Embedding for Dimensionality Reduction
- arxiv url: http://arxiv.org/abs/2002.02844v1
- Date: Fri, 7 Feb 2020 15:30:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 03:49:55.833247
- Title: Stable Sparse Subspace Embedding for Dimensionality Reduction
- Title(参考訳): 寸法低減のための安定スパース部分空間埋め込み
- Authors: Li Chen, Shuizheng Zhou, Jiajun Ma
- Abstract要約: 本稿では,統計的に置き換えることなくランダムサンプリングに基づいて,安定なスパース部分空間埋め込み行列を構築した。
S-SSEは既存の行列よりも安定であることが証明され、次元減少後の点間のユークリッド距離を維持することができる。
- 参考スコア(独自算出の注目度): 9.033485533901658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sparse random projection (RP) is a popular tool for dimensionality reduction
that shows promising performance with low computational complexity. However, in
the existing sparse RP matrices, the positions of non-zero entries are usually
randomly selected. Although they adopt uniform sampling with replacement, due
to large sampling variance, the number of non-zeros is uneven among rows of the
projection matrix which is generated in one trial, and more data information
may be lost after dimension reduction. To break this bottleneck, based on
random sampling without replacement in statistics, this paper builds a stable
sparse subspace embedded matrix (S-SSE), in which non-zeros are uniformly
distributed. It is proved that the S-SSE is stabler than the existing matrix,
and it can maintain Euclidean distance between points well after dimension
reduction. Our empirical studies corroborate our theoretical findings and
demonstrate that our approach can indeed achieve satisfactory performance.
- Abstract(参考訳): スパース・ランダム・プロジェクション(RP)は、計算複雑性の低い有望な性能を示す次元減少のための一般的なツールである。
しかし、既存のスパースRP行列では、非ゼロ成分の位置は通常ランダムに選択される。
サンプルのばらつきが大きいため、置換した均一サンプリングを採用するが、1回の試行で生成されるプロジェクション行列の行間に非ゼロの数が不均一であり、次元減少後により多くのデータ情報が失われる可能性がある。
このボトルネックを解消するために,統計的に置き換えることなくランダムサンプリングを行い,非零点が一様分布する安定なスパース部分空間埋め込み行列 (s-sse) を構築した。
S-SSEは既存の行列よりも安定であることが証明され、次元減少後の点間のユークリッド距離を維持することができる。
我々の実証研究は、我々の理論的な発見を裏付け、我々のアプローチが本当に満足できる性能を達成できることを示す。
関連論文リスト
- Entry-Specific Bounds for Low-Rank Matrix Completion under Highly
Non-Uniform Sampling [10.824999179337558]
行列全体よりも小さい部分行列上で推定アルゴリズムを実行する方がよく、時には最適であることを示す。
我々の境界は、各エントリを局所的なサンプリング確率の関数として推定する難しさを特徴付ける。
論文 参考訳(メタデータ) (2024-02-29T23:24:43Z) - Optimal Projections for Discriminative Dictionary Learning using the JL-lemma [0.5461938536945723]
次元減少に基づく辞書学習法は、しばしば反復的ランダムプロジェクションを用いている。
本稿では、ジョンソン-リンデンシュトラウス補題を用いて、投影行列をデランドマイズする構成的手法を提案する。
論文 参考訳(メタデータ) (2023-08-27T02:59:59Z) - Recovering Simultaneously Structured Data via Non-Convex Iteratively
Reweighted Least Squares [0.8702432681310401]
線形観測から多種多様低次元構造に固執するデータを復元する新しいアルゴリズムを提案する。
IRLS法は,低/複合状態の計測に好適であることを示す。
論文 参考訳(メタデータ) (2023-06-08T06:35:47Z) - On the Size and Approximation Error of Distilled Sets [57.61696480305911]
カーネル・インジェクション・ポイント(Kernel Inducing Points)などのデータセット蒸留のカーネル・リッジ回帰に基づく手法について理論的に考察する。
我々は、RFF空間におけるその解が元のデータの解と一致するように、元の入力空間に小さな一組のインスタンスが存在することを証明した。
KRR溶液は、全入力データに最適化されたKRR溶液に対して近似を与えるこの蒸留されたインスタンスセットを用いて生成することができる。
論文 参考訳(メタデータ) (2023-05-23T14:37:43Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Unfolding Projection-free SDP Relaxation of Binary Graph Classifier via
GDPA Linearization [59.87663954467815]
アルゴリズムの展開は、モデルベースのアルゴリズムの各イテレーションをニューラルネットワーク層として実装することにより、解釈可能で類似のニューラルネットワークアーキテクチャを生成する。
本稿では、Gershgorin disc perfect alignment (GDPA)と呼ばれる最近の線形代数定理を利用して、二進グラフの半定値プログラミング緩和(SDR)のためのプロジェクションフリーアルゴリズムをアンロールする。
実験結果から,我々の未学習ネットワークは純粋モデルベースグラフ分類器よりも優れ,純粋データ駆動ネットワークに匹敵する性能を示したが,パラメータははるかに少なかった。
論文 参考訳(メタデータ) (2021-09-10T07:01:15Z) - Tensor Random Projection for Low Memory Dimension Reduction [22.715952036307648]
ランダムプロジェクションは、構造情報を維持しながらベクトルの集合の次元を減少させる。
本稿では,ランダムプロジェクションにおける行積ランダム行列の新規利用を提案する。
既存の次元縮小写像よりも大幅に少ないメモリを必要とする。
論文 参考訳(メタデータ) (2021-04-30T22:08:04Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Spatially Adaptive Inference with Stochastic Feature Sampling and
Interpolation [72.40827239394565]
スパースサンプリングされた場所のみの機能を計算することを提案する。
次に、効率的な手順で特徴写像を密に再構築する。
提案したネットワークは、様々なコンピュータビジョンタスクの精度を維持しながら、かなりの計算を省くために実験的に示されている。
論文 参考訳(メタデータ) (2020-03-19T15:36:31Z) - Improved Subsampled Randomized Hadamard Transform for Linear SVM [18.52747917850984]
我々は,一様サンプリングSRHTの代わりに,効率的な低次元埋め込みを実現するために,重要サンプリングと決定論的トップ・ドルサンプリングを提案する。
実験により,提案手法はSRHTや他の6つの実生活データセット上のランダムな投影法よりも高い分類精度が得られることが示された。
論文 参考訳(メタデータ) (2020-02-05T04:09:23Z) - Optimal Iterative Sketching with the Subsampled Randomized Hadamard
Transform [64.90148466525754]
最小二乗問題に対する反復スケッチの性能について検討する。
本研究では、Haar行列とランダム化されたHadamard行列の収束速度が同一であることを示し、ランダムなプロジェクションを経時的に改善することを示した。
これらの手法は、ランダム化次元還元を用いた他のアルゴリズムにも適用することができる。
論文 参考訳(メタデータ) (2020-02-03T16:17:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。