論文の概要: Sketched Gaussian Model Linear Discriminant Analysis via the Randomized
Kaczmarz Method
- arxiv url: http://arxiv.org/abs/2211.05749v1
- Date: Thu, 10 Nov 2022 18:29:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 15:49:30.764934
- Title: Sketched Gaussian Model Linear Discriminant Analysis via the Randomized
Kaczmarz Method
- Title(参考訳): ランダム化 Kaczmarz 法によるSketched Gaussian Model Linear Discriminant Analysis
- Authors: Jocelyn T. Chi and Deanna Needell
- Abstract要約: 超大規模データに対する二進法クラスガウスモデル線形判別分析(LDA)に対する反復的ランダム化手法であるスケッチ付き線形判別分析を提案する。
最小二乗の定式化を利用して、降下勾配の枠組みを動員する。
一定回数の反復で新しいデータに対するスケッチ付き予測を収束保証する。
- 参考スコア(独自算出の注目度): 7.593861427248019
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present sketched linear discriminant analysis, an iterative randomized
approach to binary-class Gaussian model linear discriminant analysis (LDA) for
very large data. We harness a least squares formulation and mobilize the
stochastic gradient descent framework. Therefore, we obtain a randomized
classifier with performance that is very comparable to that of full data LDA
while requiring access to only one row of the training data at a time. We
present convergence guarantees for the sketched predictions on new data within
a fixed number of iterations. These guarantees account for both the Gaussian
modeling assumptions on the data and algorithmic randomness from the sketching
procedure. Finally, we demonstrate performance with varying step-sizes and
numbers of iterations. Our numerical experiments demonstrate that sketched LDA
can offer a very viable alternative to full data LDA when the data may be too
large for full data analysis.
- Abstract(参考訳): 超大規模データに対する二分級gaussian model linear discriminant analysis (lda) の反復的ランダム化手法であるsketched linear discriminant analysisを提案する。
我々は,最小二乗定式化を活用し,確率的勾配降下の枠組みを動員する。
そこで本研究では,一度に1行のトレーニングデータにのみアクセスしながら,全データLDAに非常に匹敵する性能を有するランダム化分類器を得る。
我々は,新しいデータのスケッチ予測を一定回数のイテレーション内で収束保証する。
これらの保証は、データのガウス的モデリング仮定とスケッチ処理からのアルゴリズム的ランダム性の両方を説明する。
最後に,様々なステップサイズとイテレーション数でパフォーマンスを示す。
我々の数値実験は、スケッチされたLDAが完全なデータ解析には大きすぎる場合、完全なデータLDAに代わる非常に有効な代替手段を提供することを示した。
関連論文リスト
- Inference in Randomized Least Squares and PCA via Normality of Quadratic Forms [19.616162116973637]
ランダムなスケッチや投影による統計的推測のための統一手法を開発した。
この手法は固定データセット(すなわちデータ条件)に適用され、ランダム性だけがランダム化アルゴリズムによるものである。
論文 参考訳(メタデータ) (2024-04-01T04:35:44Z) - Minimally Informed Linear Discriminant Analysis: training an LDA model
with unlabelled data [51.673443581397954]
本研究では,LDAモデルからの正確な射影ベクトルを,ラベルのないデータに基づいて計算可能であることを示す。
MILDA投影ベクトルはLDAに匹敵する計算コストで閉じた形で計算可能であることを示す。
論文 参考訳(メタデータ) (2023-10-17T09:50:31Z) - Probabilistic Unrolling: Scalable, Inverse-Free Maximum Likelihood
Estimation for Latent Gaussian Models [69.22568644711113]
我々は,モンテカルロサンプリングと反復線形解法を組み合わせた確率的アンローリングを導入し,行列逆転を回避した。
理論的解析により,解法の繰り返しによる解法の解法と逆転が最大値推定の勾配推定を高速化することを示した。
シミュレーションおよび実データ実験において、確率的アンロールは、モデル性能の損失を最小限に抑えながら、勾配EMよりも桁違いに高速な潜在ガウスモデルを学習することを示した。
論文 参考訳(メタデータ) (2023-06-05T21:08:34Z) - Score-based Diffusion Models in Function Space [140.792362459734]
拡散モデルは、最近、生成モデリングの強力なフレームワークとして登場した。
本稿では,関数空間における拡散モデルをトレーニングするためのDDO(Denoising Diffusion Operators)という,数学的に厳密なフレームワークを提案する。
データ解像度に依存しない固定コストで、対応する離散化アルゴリズムが正確なサンプルを生成することを示す。
論文 参考訳(メタデータ) (2023-02-14T23:50:53Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Algorithmic Gaussianization through Sketching: Converting Data into
Sub-gaussian Random Designs [22.925108493465363]
平均化によるデータ分布のガウシアン化のためのアルゴリズムフレームワークを提供する。
我々は、ガウス以下のランダムな設計とほとんど区別できないデータスケッチを効率的に構築できることを示す。
論文 参考訳(メタデータ) (2022-06-21T12:16:45Z) - Probabilistic Registration for Gaussian Process 3D shape modelling in
the presence of extensive missing data [63.8376359764052]
本稿では,ガウス過程の定式化に基づく形状適合/登録手法を提案する。
様々な変換を持つ2次元の小さなデータセットと耳の3次元データセットの両方で実験が行われる。
論文 参考訳(メタデータ) (2022-03-26T16:48:27Z) - Adaptive Cholesky Gaussian Processes [7.684183064816171]
本稿では,データの部分集合のみを考慮し,正確なガウス過程モデルを大規模データセットに適合させる手法を提案する。
我々のアプローチは、計算オーバーヘッドが少ない正確な推論中に、サブセットのサイズがフライで選択されるという点で新しくなっています。
論文 参考訳(メタデータ) (2022-02-22T09:43:46Z) - Least Squares Regression with Markovian Data: Fundamental Limits and
Algorithms [69.45237691598774]
マルコフ連鎖からデータポイントが依存しサンプリングされる最小二乗線形回帰問題について検討する。
この問題を$tau_mathsfmix$という観点から、鋭い情報理論のミニマックス下限を確立する。
本稿では,経験的リプレイに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-16T04:26:50Z) - Semi-analytic approximate stability selection for correlated data in
generalized linear models [3.42658286826597]
そこで本研究では,繰り返しのフィッティングを行なわずに安定選択を行うことのできる,新しい近似推論アルゴリズムを提案する。
このアルゴリズムは,情報理論の統計力学とベクトル近似メッセージパッシングの複製法に基づく。
数値実験により, このアルゴリズムは, 合成データと実世界のデータの両方に対して, 高速収束と高い近似精度を示すことを示した。
論文 参考訳(メタデータ) (2020-03-19T10:43:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。