論文の概要: Clustering, multicollinearity, and singular vectors
- arxiv url: http://arxiv.org/abs/2008.03368v1
- Date: Fri, 7 Aug 2020 20:32:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 00:45:03.719810
- Title: Clustering, multicollinearity, and singular vectors
- Title(参考訳): クラスタリング、多重線型性、特異ベクトル
- Authors: Hamid Usefi
- Abstract要約: A$ を擬似行列 $Adagger$ の行列とし、$S=I-AdaggerA$ をセットする。
A$ の列を再順序付けした後、行列 $S$ はブロック対角形を持ち、各ブロックは線形依存列の集合に対応する。
- 参考スコア(独自算出の注目度): 2.055949720959582
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Let $A$ be a matrix with its pseudo-matrix $A^{\dagger}$ and set
$S=I-A^{\dagger}A$. We prove that, after re-ordering the columns of $A$, the
matrix $S$ has a block-diagonal form where each block corresponds to a set of
linearly dependent columns. This allows us to identify redundant columns in
$A$. We explore some applications in supervised and unsupervised learning,
specially feature selection, clustering, and sensitivity of solutions of least
squares solutions.
- Abstract(参考訳): a$ を擬似行列 $a^{\dagger}$ を持つ行列とし、$s=i-a^{\dagger}a$ とする。
A$ の列を再順序付けした後、行列 $S$ はブロック対角形を持ち、各ブロックは線形依存列の集合に対応する。
これにより、$A$で冗長列を識別できます。
我々は,教師付き学習や教師なし学習,特に特徴選択,クラスタリング,最小二乗解の解の感度といった応用について検討する。
関連論文リスト
- LevAttention: Time, Space, and Streaming Efficient Algorithm for Heavy Attentions [54.54897832889028]
任意の$K$に対して、$n$とは独立に「普遍集合」$Uサブセット[n]$が存在し、任意の$Q$と任意の行$i$に対して、大きな注目スコアが$A_i,j$ in row $i$ of $A$は全て$jin U$を持つことを示す。
我々は、視覚変換器のスキームの利点を実証的に示し、トレーニング中に我々の普遍的なセットを使用する新しいモデルのトレーニング方法を示した。
論文 参考訳(メタデータ) (2024-10-07T19:47:13Z) - Efficient Matrix Factorization Via Householder Reflections [2.3326951882644553]
我々は$mathbfH$と$mathbfX$を$mathbfY$から正確に回収することが、$mathbfY$の$Omega$列で保証されていることを示す。
この研究のテクニックが、辞書学習のための代替アルゴリズムの開発に役立つことを願っている。
論文 参考訳(メタデータ) (2024-05-13T11:13:49Z) - One-sided Matrix Completion from Two Observations Per Row [95.87811229292056]
行列の欠落値を$XTX$で計算する自然アルゴリズムを提案する。
合成データの一方の回収と低被覆ゲノムシークエンシングについて,本アルゴリズムの評価を行った。
論文 参考訳(メタデータ) (2023-06-06T22:35:16Z) - Spectral properties of sample covariance matrices arising from random
matrices with independent non identically distributed columns [50.053491972003656]
関数 $texttr(AR(z))$, for $R(z) = (frac1nXXT- zI_p)-1$ and $Ain mathcal M_p$ deterministic, have a standard deviation of order $O(|A|_* / sqrt n)$.
ここでは、$|mathbb E[R(z)] - tilde R(z)|_F を示す。
論文 参考訳(メタデータ) (2021-09-06T14:21:43Z) - Learning a Latent Simplex in Input-Sparsity Time [58.30321592603066]
我々は、$AinmathbbRdtimes n$へのアクセスを考えると、潜入$k$-vertex simplex $KsubsetmathbbRdtimes n$を学習する問題を考える。
実行時間における$k$への依存は、トップ$k$特異値の質量が$a$であるという自然な仮定から不要であることを示す。
論文 参考訳(メタデータ) (2021-05-17T16:40:48Z) - Farthest sampling segmentation of triangulated surfaces [0.0]
Farthest Sampling (FSS) は三角形曲面の分割法である。
FSS法は手動で調整しなければならないパラメータに依存しず、非常に柔軟である。
いくつかの測定値と多種多様な3次元三角形メッシュによる数値実験により、W$の10%未満の計算で得られたセグメンテーションは、W$の完全な行列の行をクラスタリングすることによって得られるものと同等に優れていることが示された。
論文 参考訳(メタデータ) (2020-12-01T13:31:44Z) - Vector-Matrix-Vector Queries for Solving Linear Algebra, Statistics, and
Graph Problems [58.83118651518438]
ベクトル行列ベクトルクエリを用いて行列について学習する一般的な問題を考える。
これらのクエリは、固定フィールド上の$boldsymbolumathrmTboldsymbolMboldsymbolv$の値を提供する。
我々は、線形代数、統計、グラフにまたがる様々な問題に対して、新しい上界と下界を提供する。
論文 参考訳(メタデータ) (2020-06-24T19:33:49Z) - Average Case Column Subset Selection for Entrywise $\ell_1$-Norm Loss [76.02734481158458]
最悪の場合、行列に対する良いランク-$k$近似を得るには、任意に大きい$nOmega(1)$列数が必要であることが知られている。
最小かつ現実的な分布設定では、ほぼ線形な実行時間を持つ$(k/epsilon)$-approximationとpoly$(k/epsilon)+O(klog n)$ columnsが得られる。
これは、エントリワイズで$(k/epsilon)$-approximationを達成するための任意の種類の最初のアルゴリズムである
論文 参考訳(メタデータ) (2020-04-16T22:57:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。