論文の概要: A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data
- arxiv url: http://arxiv.org/abs/2201.12020v4
- Date: Mon, 22 May 2023 10:36:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 06:34:29.829182
- Title: A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data
- Title(参考訳): 楕円分布と欠測データとの混合に対するロバストかつ柔軟なEMアルゴリズム
- Authors: Florian Mouret, Alexandre Hippert-Ferrer, Fr\'ed\'eric Pascal,
Jean-Yves Tourneret
- Abstract要約: 本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
- 参考スコア(独自算出の注目度): 71.9573352891936
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper tackles the problem of missing data imputation for noisy and
non-Gaussian data. A classical imputation method, the Expectation Maximization
(EM) algorithm for Gaussian mixture models, has shown interesting properties
when compared to other popular approaches such as those based on k-nearest
neighbors or on multiple imputations by chained equations. However, Gaussian
mixture models are known to be non-robust to heterogeneous data, which can lead
to poor estimation performance when the data is contaminated by outliers or
follows non-Gaussian distributions. To overcome this issue, a new EM algorithm
is investigated for mixtures of elliptical distributions with the property of
handling potential missing data. This paper shows that this problem reduces to
the estimation of a mixture of Angular Gaussian distributions under generic
assumptions (i.e., each sample is drawn from a mixture of elliptical
distributions, which is possibly different for one sample to another). In that
case, the complete-data likelihood associated with mixtures of elliptical
distributions is well adapted to the EM framework with missing data thanks to
its conditional distribution, which is shown to be a multivariate
$t$-distribution. Experimental results on synthetic data demonstrate that the
proposed algorithm is robust to outliers and can be used with non-Gaussian
data. Furthermore, experiments conducted on real-world datasets show that this
algorithm is very competitive when compared to other classical imputation
methods.
- Abstract(参考訳): 本稿では,ノイズおよび非ガウスデータに対するデータインプテーションの欠如問題に対処する。
ガウス混合モデルに対する古典的計算法である期待最大化(EM)アルゴリズムは、k-アネレスト近傍や連鎖方程式による多重計算のような他の一般的なアプローチと比較して興味深い性質を示している。
しかし、ガウス混合モデルは異種データに対する非ロバストであることが知られており、データが異常値によって汚染されたり、非ガウス分布に従えば、推定性能が低下する可能性がある。
この問題を克服するため,楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
本稿は、一般的な仮定の下でのAngular Gaussian分布の混合(例えば、各サンプルは楕円分布の混合から引き出されるが、これはあるサンプルが他のサンプルと異なる可能性がある)に還元されることを示す。
その場合、楕円分布の混合に付随する完全データ確率は、その条件分布が多変量$t$-distributionであることが示されるため、データ不足を伴うEMフレームワークによく適合する。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
さらに、実世界のデータセットで実施された実験は、このアルゴリズムが他の古典的計算法と比較して非常に競争力があることを示している。
関連論文リスト
- The Breakdown of Gaussian Universality in Classification of High-dimensional Mixtures [6.863637695977277]
一般的な混合データ環境下での分類における経験的リスク最小化の高次元的特徴について述べる。
ガウス普遍性の条件を定義し、損失関数の選択に対するそれらの意味について議論する。
論文 参考訳(メタデータ) (2024-10-08T01:45:37Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Fast Semisupervised Unmixing Using Nonconvex Optimization [80.11512905623417]
半/ライブラリベースのアンミックスのための新しい凸凸モデルを提案する。
スパース・アンミキシングの代替手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-01-23T10:07:41Z) - Gaussian Mixture Solvers for Diffusion Models [84.83349474361204]
本稿では,拡散モデルのためのGMSと呼ばれる,SDEに基づく新しい解法について紹介する。
画像生成およびストロークベース合成におけるサンプル品質の観点から,SDEに基づく多くの解法よりも優れる。
論文 参考訳(メタデータ) (2023-11-02T02:05:38Z) - Mixture of von Mises-Fisher distribution with sparse prototypes [0.0]
von Mises-Fisher分布の混合は、単位超球面上のデータをクラスタリングするのに使うことができる。
本稿では,l1のペナル化確率を用いてフォン・ミーゼス混合物を推定する。
論文 参考訳(メタデータ) (2022-12-30T08:00:38Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Joint Probability Estimation Using Tensor Decomposition and Dictionaries [3.4720326275851994]
本研究では, 与えられた離散確率と連続確率変数の連立確率の非パラメトリック推定を, それらの(経験的推定)2次元境界値から検討した。
我々は、データを調べて分布の様々なファミリーの辞書を作成し、それを混合した製品の各分解因子を近似するために利用する。
論文 参考訳(メタデータ) (2022-03-03T11:55:51Z) - Clustering a Mixture of Gaussians with Unknown Covariance [4.821312633849745]
最大極大推定に基づくMax-Cut整数プログラムを導出する。
最適な速度を得るが、2次サンプルサイズを必要とする効率的なスペクトルアルゴリズムを開発する。
我々は Max-Cut プログラムを$k$-means プログラムに一般化する。
論文 参考訳(メタデータ) (2021-10-04T17:59:20Z) - A similarity-based Bayesian mixture-of-experts model [0.5156484100374058]
多変量回帰問題に対する新しい非パラメトリック混合実験モデルを提案する。
条件付きモデルを用いて、サンプル外入力の予測は、観測された各データポイントと類似性に基づいて行われる。
混合物のパラメータと距離測定値に基づいて後部推論を行う。
論文 参考訳(メタデータ) (2020-12-03T18:08:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。