論文の概要: Sketched Gaussian Model Linear Discriminant Analysis via the Randomized
Kaczmarz Method
- arxiv url: http://arxiv.org/abs/2211.05749v1
- Date: Thu, 10 Nov 2022 18:29:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-11-11 15:49:30.764934
- Title: Sketched Gaussian Model Linear Discriminant Analysis via the Randomized
Kaczmarz Method
- Title(参考訳): ランダム化 Kaczmarz 法によるSketched Gaussian Model Linear Discriminant Analysis
- Authors: Jocelyn T. Chi and Deanna Needell
- Abstract要約: 超大規模データに対する二進法クラスガウスモデル線形判別分析(LDA)に対する反復的ランダム化手法であるスケッチ付き線形判別分析を提案する。
最小二乗の定式化を利用して、降下勾配の枠組みを動員する。
一定回数の反復で新しいデータに対するスケッチ付き予測を収束保証する。
- 参考スコア(独自算出の注目度): 7.593861427248019
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present sketched linear discriminant analysis, an iterative randomized
approach to binary-class Gaussian model linear discriminant analysis (LDA) for
very large data. We harness a least squares formulation and mobilize the
stochastic gradient descent framework. Therefore, we obtain a randomized
classifier with performance that is very comparable to that of full data LDA
while requiring access to only one row of the training data at a time. We
present convergence guarantees for the sketched predictions on new data within
a fixed number of iterations. These guarantees account for both the Gaussian
modeling assumptions on the data and algorithmic randomness from the sketching
procedure. Finally, we demonstrate performance with varying step-sizes and
numbers of iterations. Our numerical experiments demonstrate that sketched LDA
can offer a very viable alternative to full data LDA when the data may be too
large for full data analysis.
- Abstract(参考訳): 超大規模データに対する二分級gaussian model linear discriminant analysis (lda) の反復的ランダム化手法であるsketched linear discriminant analysisを提案する。
我々は,最小二乗定式化を活用し,確率的勾配降下の枠組みを動員する。
そこで本研究では,一度に1行のトレーニングデータにのみアクセスしながら,全データLDAに非常に匹敵する性能を有するランダム化分類器を得る。
我々は,新しいデータのスケッチ予測を一定回数のイテレーション内で収束保証する。
これらの保証は、データのガウス的モデリング仮定とスケッチ処理からのアルゴリズム的ランダム性の両方を説明する。
最後に,様々なステップサイズとイテレーション数でパフォーマンスを示す。
我々の数値実験は、スケッチされたLDAが完全なデータ解析には大きすぎる場合、完全なデータLDAに代わる非常に有効な代替手段を提供することを示した。
関連論文リスト
- An Iterative Bayesian Approach for System Identification based on Linear Gaussian Models [86.05414211113627]
システム識別の問題に取り組み、入力を選択し、実際のシステムから対応する出力を観測し、データに最も合うようにモデルのパラメータを最適化する。
本稿では,任意のシステムやパラメトリックモデルと互換性のある,フレキシブルで計算可能な手法を提案する。
論文 参考訳(メタデータ) (2025-01-28T01:57:51Z) - Computation-Aware Gaussian Processes: Model Selection And Linear-Time Inference [55.150117654242706]
我々は、1.8万のデータポイントでトレーニングされた計算対応GPのモデル選択が、1つのGPU上で数時間以内に可能であることを示す。
この研究の結果、ガウス過程は、不確実性を定量化する能力を著しく妥協することなく、大規模なデータセットで訓練することができる。
論文 参考訳(メタデータ) (2024-11-01T21:11:48Z) - Inference in Randomized Least Squares and PCA via Normality of Quadratic Forms [19.616162116973637]
ランダムなスケッチや投影による統計的推測のための統一手法を開発した。
この手法は固定データセット(すなわちデータ条件)に適用され、ランダム性だけがランダム化アルゴリズムによるものである。
論文 参考訳(メタデータ) (2024-04-01T04:35:44Z) - Minimally Informed Linear Discriminant Analysis: training an LDA model
with unlabelled data [51.673443581397954]
本研究では,LDAモデルからの正確な射影ベクトルを,ラベルのないデータに基づいて計算可能であることを示す。
MILDA投影ベクトルはLDAに匹敵する計算コストで閉じた形で計算可能であることを示す。
論文 参考訳(メタデータ) (2023-10-17T09:50:31Z) - FEMDA: Une m\'ethode de classification robuste et flexible [0.8594140167290096]
本稿では,新しい識別分析手法のデータのスケール変化に対するロバスト性について検討する。
導出された新しい決定ルールは、他の最先端の方法と比較して、データのスケール変更が簡単で、高速で、堅牢である。
論文 参考訳(メタデータ) (2023-07-04T23:15:31Z) - Probabilistic Unrolling: Scalable, Inverse-Free Maximum Likelihood
Estimation for Latent Gaussian Models [69.22568644711113]
我々は,モンテカルロサンプリングと反復線形解法を組み合わせた確率的アンローリングを導入し,行列逆転を回避した。
理論的解析により,解法の繰り返しによる解法の解法と逆転が最大値推定の勾配推定を高速化することを示した。
シミュレーションおよび実データ実験において、確率的アンロールは、モデル性能の損失を最小限に抑えながら、勾配EMよりも桁違いに高速な潜在ガウスモデルを学習することを示した。
論文 参考訳(メタデータ) (2023-06-05T21:08:34Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Spectrally-Corrected and Regularized Linear Discriminant Analysis for
Spiked Covariance Model [2.517838307493912]
本稿では、スペクトル補正および正規化LDA(SRLDA)と呼ばれる線形判別分析の改善を提案する。
SRLDAはスパイクモデル仮定の下で線形分類大域最適解を持つことが証明された。
異なるデータセットに対する実験により、SRLDAアルゴリズムは、現在使われているツールよりも分類と次元の削減が優れていることが示された。
論文 参考訳(メタデータ) (2022-10-08T00:47:50Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Algorithmic Gaussianization through Sketching: Converting Data into
Sub-gaussian Random Designs [22.925108493465363]
平均化によるデータ分布のガウシアン化のためのアルゴリズムフレームワークを提供する。
我々は、ガウス以下のランダムな設計とほとんど区別できないデータスケッチを効率的に構築できることを示す。
論文 参考訳(メタデータ) (2022-06-21T12:16:45Z) - Probabilistic Registration for Gaussian Process 3D shape modelling in
the presence of extensive missing data [63.8376359764052]
本稿では,ガウス過程の定式化に基づく形状適合/登録手法を提案する。
様々な変換を持つ2次元の小さなデータセットと耳の3次元データセットの両方で実験が行われる。
論文 参考訳(メタデータ) (2022-03-26T16:48:27Z) - Varying Coefficient Linear Discriminant Analysis for Dynamic Data [5.228711636020666]
本稿では,動的データに対する変動係数LDAモデルについて検討する。
ベイズ方向と平行な新たな識別方向関数を導出することにより,最小二乗推定法を提案する。
高次元の場合、対応するデータ駆動判別法則は、既存の動的線形プログラミング法則よりも計算的に効率的である。
論文 参考訳(メタデータ) (2022-03-12T07:32:19Z) - Adaptive Cholesky Gaussian Processes [7.684183064816171]
本稿では,データの部分集合のみを考慮し,正確なガウス過程モデルを大規模データセットに適合させる手法を提案する。
我々のアプローチは、計算オーバーヘッドが少ない正確な推論中に、サブセットのサイズがフライで選択されるという点で新しくなっています。
論文 参考訳(メタデータ) (2022-02-22T09:43:46Z) - Least Squares Regression with Markovian Data: Fundamental Limits and
Algorithms [69.45237691598774]
マルコフ連鎖からデータポイントが依存しサンプリングされる最小二乗線形回帰問題について検討する。
この問題を$tau_mathsfmix$という観点から、鋭い情報理論のミニマックス下限を確立する。
本稿では,経験的リプレイに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-16T04:26:50Z) - A Doubly Regularized Linear Discriminant Analysis Classifier with
Automatic Parameter Selection [24.027886914804775]
線形判別分析(LDA)に基づく分類器は、訓練データのサイズが特徴数よりも小さい、あるいは同等であるような多くの実践的な設定で混乱する傾向にある。
R2LDAと表す2つの正規化LDA分類器を提案する。
合成データと実データの両方から得られた結果は,提案したR2LDA手法の一貫性と有効性を示す。
論文 参考訳(メタデータ) (2020-04-28T07:09:22Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - Saliency-based Weighted Multi-label Linear Discriminant Analysis [101.12909759844946]
複数ラベルの分類課題を解決するために,LDA(Linear Discriminant Analysis)の新たな変種を提案する。
提案手法は,個々の試料の重量を定義する確率モデルに基づく。
サリエンシに基づく重み付きマルチラベル LDA アプローチは,様々なマルチラベル分類問題の性能改善につながることが示されている。
論文 参考訳(メタデータ) (2020-04-08T19:40:53Z) - Semi-analytic approximate stability selection for correlated data in
generalized linear models [3.42658286826597]
そこで本研究では,繰り返しのフィッティングを行なわずに安定選択を行うことのできる,新しい近似推論アルゴリズムを提案する。
このアルゴリズムは,情報理論の統計力学とベクトル近似メッセージパッシングの複製法に基づく。
数値実験により, このアルゴリズムは, 合成データと実世界のデータの両方に対して, 高速収束と高い近似精度を示すことを示した。
論文 参考訳(メタデータ) (2020-03-19T10:43:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。