論文の概要: Fast estimation of Gaussian mixture components via centering and singular value thresholding
- arxiv url: http://arxiv.org/abs/2604.19091v1
- Date: Tue, 21 Apr 2026 05:03:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.630393
- Title: Fast estimation of Gaussian mixture components via centering and singular value thresholding
- Title(参考訳): 中心値と特異値しきい値を用いたガウス混合成分の高速推定
- Authors: Huan Qing,
- Abstract要約: コンポーネント数の推定は教師なし学習における根本的な課題である。
本稿では、古典ガウス混合モデルに対するこの問題に対処する。
提案する推定器は,データ中心,中心行列の特異値計算,しきい値以上をカウントする。
- 参考スコア(独自算出の注目度): 4.314956204483074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating the number of components is a fundamental challenge in unsupervised learning, particularly when dealing with high-dimensional data with many components or severely imbalanced component sizes. This paper addresses this challenge for classical Gaussian mixture models. The proposed estimator is simple: center the data, compute the singular values of the centered matrix, and count those above a threshold. No iterative fitting, no likelihood calculation, and no prior knowledge of the number of components are required. We prove that, under a mild separation condition on the component centers, the estimator consistently recovers the true number of components. The result holds in high-dimensional settings where the dimension can be much larger than the sample size. It also holds when the number of components grows to the smaller of the dimension and the sample size, even under severe imbalance among component sizes. Computationally, the method is extremely fast: for example, it processes ten million samples in one hundred dimensions within one minute. Extensive experimental studies confirm its accuracy in challenging settings such as high dimensionality, many components, and severe class imbalance.
- Abstract(参考訳): コンポーネント数の推定は教師なし学習における基本的な課題であり、特に多くのコンポーネントで高次元のデータを扱う場合や、非常に不均衡なコンポーネントのサイズを扱う場合である。
本稿では、古典ガウス混合モデルに対するこの問題に対処する。
提案する推定器は,データ中心,中心行列の特異値計算,しきい値以上をカウントする。
反復的なフィッティングも、確率計算も、部品の数に関する事前の知識も不要である。
成分中心上の緩やかな分離条件下では、推定器は成分の真の数を常に回復する。
その結果、寸法がサンプルサイズよりもはるかに大きいような高次元の設定が得られる。
また、コンポーネントの数が寸法やサンプルサイズよりも小さくなると、コンポーネントサイズの間に深刻な不均衡の下でも維持される。
例えば、1分で100次元で1000万のサンプルを処理します。
大規模な実験により、高次元性、多くの構成要素、重度のクラス不均衡といった挑戦的な設定において、その正確性が確認された。
関連論文リスト
- Model Selection and Parameter Estimation of Multi-dimensional Gaussian Mixture Model [5.917400794867873]
多次元ガウス混合モデル(GMM)の学習問題について検討する。
まず、信頼性の高い選択に必要な情報理論の低いサンプルを確立する。
そこで我々は,経験的共分散行列のスペクトルギャップを評価するしきい値に基づく推定法を提案する。
論文 参考訳(メタデータ) (2026-03-20T05:45:24Z) - Mixed precision accumulation for neural network inference guided by componentwise forward error analysis [2.4374097382908477]
ニューラルネットワークの推論のための数学的に確立された混合精度蓄積戦略を提案する。
我々の戦略は、ニューラルネットワークの前方通過におけるエラーの伝播を説明する新しいコンポーネントワイズ・フォワード・エラー分析に基づいている。
論文 参考訳(メタデータ) (2025-03-19T09:19:11Z) - Optimizing Singular Spectrum for Large Language Model Compression [95.7621116637755]
SVDの分解したコンポーネントをデータ駆動で再スケールする新しい圧縮フレームワークであるSoCoを紹介する。
学習可能な特異スペクトルのおかげで、SoCoは重要度スコアに応じて成分を適応的にプーンする。
複数のLLMおよびベンチマークでの実験的な評価は、SoCoがモデル圧縮における最先端の手法を超越していることを示している。
論文 参考訳(メタデータ) (2025-02-20T23:18:39Z) - Robust Mixture Learning when Outliers Overwhelm Small Groups [51.49063715477438]
敵が任意の外れ値を加える場合、適切に分離された混合の手段を推定する問題について検討する。
本稿では,各混合平均値に対して,最小のリストサイズオーバーヘッドで順序-最適誤差を保証するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-22T16:51:05Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Fixed-point iterations for several dissimilarity measure barycenters in
the Gaussian case [69.9674326582747]
目標追跡とセンサ融合の文脈では、多数のガウス密度を扱うことは珍しくない。
FPI(Fixed-Point Iterations)は、いくつかの異なる尺度に従って、バリセンタの計算を行う。
論文 参考訳(メタデータ) (2022-05-10T11:12:12Z) - Entanglement estimation in tensor network states via sampling [0.688204255655161]
一般次元におけるテンソルネットワーク状態の有意義な絡み合いを抽出する手法を提案する。
チェッカーボード形状の1次元臨界XX連鎖と2次元トーリック符号について,本手法を検証した。
論文 参考訳(メタデータ) (2022-02-08T19:00:03Z) - Shared Independent Component Analysis for Multi-Subject Neuroimaging [107.29179765643042]
本稿では,ShICA (Shared Independent Component Analysis) を導入し,各ビューを加法ガウス雑音によって汚染された共有独立成分の線形変換としてモデル化する。
このモデルは、成分がガウス的でないか、あるいはノイズ分散に十分な多様性がある場合、同定可能であることを示す。
我々は,fMRIおよびMEGデータセットの実証的証拠として,ShICAが代替品よりも正確な成分推定を行うことを示す。
論文 参考訳(メタデータ) (2021-10-26T08:54:41Z) - Finite mixture models do not reliably learn the number of components [29.9892521137588]
一般的な提案は、コンポーネントの数に先立って有限混合モデル(FMM)を使用することである。
過去の研究は、結果のFMMコンポーネントカウントの後方が一貫したことを示している。
しかし、一貫性は、コンポーネントの可能性が完全に指定されているという仮定を必要とする。
本稿では,FMM成分数と後部偏差が最少のモデルであっても,FMM成分数と後部偏差が生じることを証明した。
論文 参考訳(メタデータ) (2020-07-08T23:05:18Z) - Interpolation and Learning with Scale Dependent Kernels [91.41836461193488]
非パラメトリックリッジレス最小二乗の学習特性について検討する。
スケール依存カーネルで定義される推定器の一般的な場合を考える。
論文 参考訳(メタデータ) (2020-06-17T16:43:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。