論文の概要: Estimating leverage scores via rank revealing methods and randomization
- arxiv url: http://arxiv.org/abs/2105.11004v1
- Date: Sun, 23 May 2021 19:21:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 15:22:02.019399
- Title: Estimating leverage scores via rank revealing methods and randomization
- Title(参考訳): ランク抽出法とランダム化によるレバレッジスコアの推定
- Authors: Aleksandros Sobczyk (1) and Efstratios Gallopoulos (2) ((1) IBM
Research Europe, Zurich, Switzerland (2) Computer Engineering and Informatics
Department, University of Patras, Greece)
- Abstract要約: 任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
- 参考スコア(独自算出の注目度): 50.591267188664666
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We study algorithms for estimating the statistical leverage scores of
rectangular dense or sparse matrices of arbitrary rank. Our approach is based
on combining rank revealing methods with compositions of dense and sparse
randomized dimensionality reduction transforms. We first develop a set of fast
novel algorithms for rank estimation, column subset selection and least squares
preconditioning. We then describe the design and implementation of leverage
score estimators based on these primitives. These estimators are also effective
for rank deficient input, which is frequently the case in data analytics
applications. We provide detailed complexity analyses for all algorithms as
well as meaningful approximation bounds and comparisons with the
state-of-the-art. We conduct extensive numerical experiments to evaluate our
algorithms and to illustrate their properties and performance using synthetic
and real world data sets.
- Abstract(参考訳): 任意のランクの直方体あるいは疎行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
まず,ランク推定,列部分集合選択,最小二乗プリコンディショニングのための一組の高速新規アルゴリズムを開発した。
次に,これらのプリミティブに基づくスコア推定器の設計と実装について述べる。
これらの推定器は、ランク不足入力にも有効であり、データ分析アプリケーションではよく使われる。
すべてのアルゴリズムの詳細な複雑性解析と有意義な近似境界と最先端との比較を提供する。
アルゴリズムを評価し,その特性と性能を合成データと実世界データを用いて説明するために,広範な数値実験を行った。
関連論文リスト
- Best-Subset Selection in Generalized Linear Models: A Fast and
Consistent Algorithm via Splicing Technique [0.6338047104436422]
ベストサブセットセクションは、このタイプの問題の聖杯として広く見なされている。
軽度条件下での最適部分集合回復のためのアルゴリズムを提案し,提案した。
我々の実装は、一般的な変数選択ツールキットと比較して約4倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2023-08-01T03:11:31Z) - Learning the Positions in CountSketch [49.57951567374372]
本稿では,まずランダムなスケッチ行列に乗じてデータを圧縮し,最適化問題を高速に解くスケッチアルゴリズムについて検討する。
本研究では,ゼロでないエントリの位置を最適化する学習ベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-11T07:28:35Z) - Best Subset Selection in Reduced Rank Regression [1.4699455652461724]
提案アルゴリズムは,有意な確率でランク推定を行うことができることを示す。
がん研究における数値的研究と応用は、有効性と拡張性を示している。
論文 参考訳(メタデータ) (2022-11-29T02:51:15Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Frequency Estimation in Data Streams: Learning the Optimal Hashing
Scheme [3.7565501074323224]
本稿では,最適化と機械学習に基づくデータストリームの周波数推定問題に対する新しいアプローチを提案する。
提案手法は、観測されたストリームプレフィックスをほぼ最適にハッシュ要素に利用し、ターゲット周波数分布を圧縮する。
提案手法は, 推定誤差の平均(要素単位)と推定誤差の平均(要素単位)で1~2桁, 予測誤差で45~90%の精度で既存手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-07-17T22:15:22Z) - Discrete-Valued Latent Preference Matrix Estimation with Graph Side
Information [12.836994708337144]
最適なサンプルの複雑さにマッチするアルゴリズムを開発する。
我々のアルゴリズムはエラーをモデル化し、予測性能の点で既存のアルゴリズムより優れている。
論文 参考訳(メタデータ) (2020-03-16T06:29:24Z) - Scalable Distributed Approximation of Internal Measures for Clustering
Evaluation [5.144809478361603]
クラスタリング評価のための内部測度はシルエット係数であり、計算には2つの距離計算が必要である。
本稿では,任意の距離に基づいてクラスタリングの評価を行うための厳密な近似を計算した最初のスケーラブルアルゴリズムを提案する。
また,このアルゴリズムは凝集や分離などのクラスタリング品質の他の内部指標の厳密な近似に適応可能であることも証明した。
論文 参考訳(メタデータ) (2020-03-03T10:28:14Z) - A General Method for Robust Learning from Batches [56.59844655107251]
本稿では,バッチから頑健な学習を行う一般的なフレームワークについて考察し,連続ドメインを含む任意の領域に対する分類と分布推定の限界について考察する。
本手法は,一括分節分類,一括分節,単調,対数凹,ガウス混合分布推定のための,最初の頑健な計算効率の学習アルゴリズムを導出する。
論文 参考訳(メタデータ) (2020-02-25T18:53:25Z) - Optimal Randomized First-Order Methods for Least-Squares Problems [56.05635751529922]
このアルゴリズムのクラスは、最小二乗問題に対する最も高速な解法のうち、いくつかのランダム化手法を含んでいる。
我々は2つの古典的埋め込み、すなわちガウス射影とアダマール変換のサブサンプリングに焦点を当てる。
得られたアルゴリズムは条件数に依存しない最小二乗問題の解法として最も複雑である。
論文 参考訳(メタデータ) (2020-02-21T17:45:32Z) - CONSAC: Robust Multi-Model Fitting by Conditional Sample Consensus [62.86856923633923]
我々は,同じ形状の複数のパラメトリックモデルを雑音測定に適合させる頑健な推定器を提案する。
複数のモデル検出のための手作り検索戦略を利用する従来の研究とは対照的に,データから検索戦略を学習する。
探索の自己教師付き学習において,提案したアルゴリズムをマルチホログラフィー推定で評価し,最先端手法よりも優れた精度を示す。
論文 参考訳(メタデータ) (2020-01-08T17:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。