論文の概要: Mixture of von Mises-Fisher distribution with sparse prototypes
- arxiv url: http://arxiv.org/abs/2212.14591v1
- Date: Fri, 30 Dec 2022 08:00:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 16:03:28.205790
- Title: Mixture of von Mises-Fisher distribution with sparse prototypes
- Title(参考訳): スパースプロトタイプを用いたvon Mises-Fisher分布の混合
- Authors: Fabrice Rossi (CEREMADE), Florian Barbaro (SAMM)
- Abstract要約: von Mises-Fisher分布の混合は、単位超球面上のデータをクラスタリングするのに使うことができる。
本稿では,l1のペナル化確率を用いてフォン・ミーゼス混合物を推定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mixtures of von Mises-Fisher distributions can be used to cluster data on the
unit hypersphere. This is particularly adapted for high-dimensional directional
data such as texts. We propose in this article to estimate a von Mises mixture
using a l 1 penalized likelihood. This leads to sparse prototypes that improve
clustering interpretability. We introduce an expectation-maximisation (EM)
algorithm for this estimation and explore the trade-off between the sparsity
term and the likelihood one with a path following algorithm. The model's
behaviour is studied on simulated data and, we show the advantages of the
approach on real data benchmark. We also introduce a new data set on financial
reports and exhibit the benefits of our method for exploratory analysis.
- Abstract(参考訳): von Mises-Fisher分布の混合は、単位超球面上のデータをクラスタリングするのに使うことができる。
これは特にテキストのような高次元の方向データに適応する。
本稿では,l1のペナル化確率を用いてフォン・ミーゼス混合を推定する。
これにより、クラスタリングの解釈性が向上するスパースプロトタイプが実現される。
本稿では,この推定のための予測最大化 (EM) アルゴリズムを導入し,提案アルゴリズムに追従する経路を持つ疎度項と可能性項とのトレードオフを探索する。
モデルの振る舞いはシミュレーションデータに基づいて研究され,本手法の利点を実データベンチマークで示す。
また、財務報告に関する新たなデータセットを導入し、探索分析のための手法の利点を示す。
関連論文リスト
- Data Pruning in Generative Diffusion Models [2.0111637969968]
生成モデルは、データの基盤となる分布を推定することを目的としている。
大規模データセットにおける冗長データやノイズデータの排除は,特に戦略的に行う場合,特に有益であることを示す。
論文 参考訳(メタデータ) (2024-11-19T14:13:25Z) - Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Fast Semisupervised Unmixing Using Nonconvex Optimization [80.11512905623417]
半/ライブラリベースのアンミックスのための新しい凸凸モデルを提案する。
スパース・アンミキシングの代替手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-01-23T10:07:41Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - A likelihood approach to nonparametric estimation of a singular
distribution using deep generative models [4.329951775163721]
深部生成モデルを用いた特異分布の非パラメトリック推定の可能性について検討する。
我々は、インスタンスノイズでデータを摂動することで、新しい効果的な解が存在することを証明した。
また、より深い生成モデルにより効率的に推定できる分布のクラスを特徴付ける。
論文 参考訳(メタデータ) (2021-05-09T23:13:58Z) - A similarity-based Bayesian mixture-of-experts model [0.5156484100374058]
多変量回帰問題に対する新しい非パラメトリック混合実験モデルを提案する。
条件付きモデルを用いて、サンプル外入力の予測は、観測された各データポイントと類似性に基づいて行われる。
混合物のパラメータと距離測定値に基づいて後部推論を行う。
論文 参考訳(メタデータ) (2020-12-03T18:08:30Z) - GENs: Generative Encoding Networks [4.269725092203672]
本稿では,未知のデータ分布と未知のターゲット分布を一致させるために,Jensen-Shannon分散を推定するための非パラメトリック密度法を提案し,解析する。
この分析法には、サンプル量のトレーニングが低いときのより良い振舞い、証明可能な収束特性、比較的少ないパラメータ、分析的に導出できるパラメータなど、いくつかの利点がある。
論文 参考訳(メタデータ) (2020-10-28T23:40:03Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。