論文の概要: Sketched Gaussian Model Linear Discriminant Analysis via the Randomized
Kaczmarz Method
- arxiv url: http://arxiv.org/abs/2211.05749v1
- Date: Thu, 10 Nov 2022 18:29:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 15:49:30.764934
- Title: Sketched Gaussian Model Linear Discriminant Analysis via the Randomized
Kaczmarz Method
- Title(参考訳): ランダム化 Kaczmarz 法によるSketched Gaussian Model Linear Discriminant Analysis
- Authors: Jocelyn T. Chi and Deanna Needell
- Abstract要約: 超大規模データに対する二進法クラスガウスモデル線形判別分析(LDA)に対する反復的ランダム化手法であるスケッチ付き線形判別分析を提案する。
最小二乗の定式化を利用して、降下勾配の枠組みを動員する。
一定回数の反復で新しいデータに対するスケッチ付き予測を収束保証する。
- 参考スコア(独自算出の注目度): 7.593861427248019
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present sketched linear discriminant analysis, an iterative randomized
approach to binary-class Gaussian model linear discriminant analysis (LDA) for
very large data. We harness a least squares formulation and mobilize the
stochastic gradient descent framework. Therefore, we obtain a randomized
classifier with performance that is very comparable to that of full data LDA
while requiring access to only one row of the training data at a time. We
present convergence guarantees for the sketched predictions on new data within
a fixed number of iterations. These guarantees account for both the Gaussian
modeling assumptions on the data and algorithmic randomness from the sketching
procedure. Finally, we demonstrate performance with varying step-sizes and
numbers of iterations. Our numerical experiments demonstrate that sketched LDA
can offer a very viable alternative to full data LDA when the data may be too
large for full data analysis.
- Abstract(参考訳): 超大規模データに対する二分級gaussian model linear discriminant analysis (lda) の反復的ランダム化手法であるsketched linear discriminant analysisを提案する。
我々は,最小二乗定式化を活用し,確率的勾配降下の枠組みを動員する。
そこで本研究では,一度に1行のトレーニングデータにのみアクセスしながら,全データLDAに非常に匹敵する性能を有するランダム化分類器を得る。
我々は,新しいデータのスケッチ予測を一定回数のイテレーション内で収束保証する。
これらの保証は、データのガウス的モデリング仮定とスケッチ処理からのアルゴリズム的ランダム性の両方を説明する。
最後に,様々なステップサイズとイテレーション数でパフォーマンスを示す。
我々の数値実験は、スケッチされたLDAが完全なデータ解析には大きすぎる場合、完全なデータLDAに代わる非常に有効な代替手段を提供することを示した。
関連論文リスト
- Minimally Informed Linear Discriminant Analysis: training an LDA model
with unlabelled data [51.673443581397954]
本研究では,LDAモデルからの正確な射影ベクトルを,ラベルのないデータに基づいて計算可能であることを示す。
MILDA投影ベクトルはLDAに匹敵する計算コストで閉じた形で計算可能であることを示す。
論文 参考訳(メタデータ) (2023-10-17T09:50:31Z) - FEMDA: Une m\'ethode de classification robuste et flexible [0.8594140167290096]
本稿では,新しい識別分析手法のデータのスケール変化に対するロバスト性について検討する。
導出された新しい決定ルールは、他の最先端の方法と比較して、データのスケール変更が簡単で、高速で、堅牢である。
論文 参考訳(メタデータ) (2023-07-04T23:15:31Z) - Probabilistic Unrolling: Scalable, Inverse-Free Maximum Likelihood
Estimation for Latent Gaussian Models [69.22568644711113]
我々は,モンテカルロサンプリングと反復線形解法を組み合わせた確率的アンローリングを導入し,行列逆転を回避した。
理論的解析により,解法の繰り返しによる解法の解法と逆転が最大値推定の勾配推定を高速化することを示した。
シミュレーションおよび実データ実験において、確率的アンロールは、モデル性能の損失を最小限に抑えながら、勾配EMよりも桁違いに高速な潜在ガウスモデルを学習することを示した。
論文 参考訳(メタデータ) (2023-06-05T21:08:34Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Spectrally-Corrected and Regularized Linear Discriminant Analysis for
Spiked Covariance Model [2.517838307493912]
本稿では、スペクトル補正および正規化LDA(SRLDA)と呼ばれる線形判別分析の改善を提案する。
SRLDAはスパイクモデル仮定の下で線形分類大域最適解を持つことが証明された。
異なるデータセットに対する実験により、SRLDAアルゴリズムは、現在使われているツールよりも分類と次元の削減が優れていることが示された。
論文 参考訳(メタデータ) (2022-10-08T00:47:50Z) - Varying Coefficient Linear Discriminant Analysis for Dynamic Data [5.228711636020666]
本稿では,動的データに対する変動係数LDAモデルについて検討する。
ベイズ方向と平行な新たな識別方向関数を導出することにより,最小二乗推定法を提案する。
高次元の場合、対応するデータ駆動判別法則は、既存の動的線形プログラミング法則よりも計算的に効率的である。
論文 参考訳(メタデータ) (2022-03-12T07:32:19Z) - Stochastic Saddle-Point Optimization for Wasserstein Barycenters [69.68068088508505]
オンラインデータストリームによって生成される有限個の点からなるランダムな確率測度に対する人口推定バリセンタ問題を考察する。
本稿では,この問題の構造を用いて,凸凹型サドル点再構成を行う。
ランダム確率測度の分布が離散的な場合、最適化アルゴリズムを提案し、その複雑性を推定する。
論文 参考訳(メタデータ) (2020-06-11T19:40:38Z) - A Doubly Regularized Linear Discriminant Analysis Classifier with
Automatic Parameter Selection [24.027886914804775]
線形判別分析(LDA)に基づく分類器は、訓練データのサイズが特徴数よりも小さい、あるいは同等であるような多くの実践的な設定で混乱する傾向にある。
R2LDAと表す2つの正規化LDA分類器を提案する。
合成データと実データの両方から得られた結果は,提案したR2LDA手法の一貫性と有効性を示す。
論文 参考訳(メタデータ) (2020-04-28T07:09:22Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - Saliency-based Weighted Multi-label Linear Discriminant Analysis [101.12909759844946]
複数ラベルの分類課題を解決するために,LDA(Linear Discriminant Analysis)の新たな変種を提案する。
提案手法は,個々の試料の重量を定義する確率モデルに基づく。
サリエンシに基づく重み付きマルチラベル LDA アプローチは,様々なマルチラベル分類問題の性能改善につながることが示されている。
論文 参考訳(メタデータ) (2020-04-08T19:40:53Z) - Semi-analytic approximate stability selection for correlated data in
generalized linear models [3.42658286826597]
そこで本研究では,繰り返しのフィッティングを行なわずに安定選択を行うことのできる,新しい近似推論アルゴリズムを提案する。
このアルゴリズムは,情報理論の統計力学とベクトル近似メッセージパッシングの複製法に基づく。
数値実験により, このアルゴリズムは, 合成データと実世界のデータの両方に対して, 高速収束と高い近似精度を示すことを示した。
論文 参考訳(メタデータ) (2020-03-19T10:43:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。