論文の概要: Empirical Density Estimation based on Spline Quasi-Interpolation with
applications to Copulas clustering modeling
- arxiv url: http://arxiv.org/abs/2402.11552v1
- Date: Sun, 18 Feb 2024 11:49:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-20 20:18:32.392320
- Title: Empirical Density Estimation based on Spline Quasi-Interpolation with
applications to Copulas clustering modeling
- Title(参考訳): スプライン準補間に基づく経験的密度推定とCopulasクラスタリングモデルへの応用
- Authors: Cristiano Tamborrino, Antonella Falini, Francesca Mazzia
- Abstract要約: 密度推定は、様々な分野において、基礎となるデータの分布をモデル化し理解するための基礎的な手法である。
本稿では,擬似補間による密度の単変量近似を提案する。
提案アルゴリズムは人工データセットと実データセットで検証される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Density estimation is a fundamental technique employed in various fields to
model and to understand the underlying distribution of data. The primary
objective of density estimation is to estimate the probability density function
of a random variable. This process is particularly valuable when dealing with
univariate or multivariate data and is essential for tasks such as clustering,
anomaly detection, and generative modeling. In this paper we propose the
mono-variate approximation of the density using spline quasi interpolation and
we applied it in the context of clustering modeling. The clustering technique
used is based on the construction of suitable multivariate distributions which
rely on the estimation of the monovariate empirical densities (marginals). Such
an approximation is achieved by using the proposed spline quasi-interpolation,
while the joint distributions to model the sought clustering partition is
constructed with the use of copulas functions. In particular, since copulas can
capture the dependence between the features of the data independently from the
marginal distributions, a finite mixture copula model is proposed. The
presented algorithm is validated on artificial and real datasets.
- Abstract(参考訳): 密度推定は、様々な分野において、基礎となるデータの分布をモデル化し理解するための基礎技術である。
密度推定の主な目的は、確率変数の確率密度関数を推定することである。
このプロセスは、非変量データや多変量データを扱う際に特に有用であり、クラスタリング、異常検出、生成モデリングといったタスクに必須である。
本稿では,スプライン準補間を用いた密度の単変量近似を提案し,クラスタリングモデリングの文脈で適用した。
クラスタリング手法は, 単変量経験密度 (marginals) の推定に依存する適切な多変量分布の構築に基づいている。
このような近似は、提案したスプライン準補間を用いて達成され、探索されたクラスタリング分割をモデル化する結合分布はコプラ関数を用いて構成される。
特に、コプラは限界分布とは独立にデータの特徴間の依存性を捉えることができるため、有限混合コプラモデルが提案されている。
提案アルゴリズムは人工データセットと実データセットで検証される。
関連論文リスト
- PQMass: Probabilistic Assessment of the Quality of Generative Models
using Probability Mass Estimation [8.527898482146103]
生成モデルの品質を評価するための包括的サンプルベース手法を提案する。
提案手法により,同じ分布から2組のサンプルが引き出される確率を推定できる。
論文 参考訳(メタデータ) (2024-02-06T19:39:26Z) - Distributed Markov Chain Monte Carlo Sampling based on the Alternating
Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。
我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。
シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文 参考訳(メタデータ) (2024-01-29T02:08:40Z) - Finite Mixtures of Multivariate Poisson-Log Normal Factor Analyzers for
Clustering Count Data [0.8499685241219366]
因子分析モデルの混合に基づく8種類の擬似混合モデルについて紹介する。
提案モデルはRNAシークエンシング研究から得られた離散的なデータをクラスタリングする文脈において探索される。
論文 参考訳(メタデータ) (2023-11-13T21:23:15Z) - Probabilistic Classification by Density Estimation Using Gaussian
Mixture Model and Masked Autoregressive Flow [1.3706331473063882]
データ分布を推定する密度推定は確率論的機械学習の重要なカテゴリである。
本稿では,密度推定器を用いて分類するが,データの分布を推定するためによく用いられる。
我々は,GMMとMAFを用いて,密度推定によるデータクラスの可能性のモデル化を行う。
論文 参考訳(メタデータ) (2023-10-16T21:37:22Z) - Copula-Based Density Estimation Models for Multivariate Zero-Inflated
Continuous Data [0.0]
ゼロインフレート連続変数間の多変量相関に対処できる2つのコプラに基づく密度推定モデルを提案する。
ゼロインフレーションデータにおける結び付きデータ問題によるコプラの使用の難しさを克服するために,我々は新しいタイプのコプラ,補正されたガウスコプラを提案する。
論文 参考訳(メタデータ) (2023-04-02T13:43:37Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Density-Based Clustering with Kernel Diffusion [59.4179549482505]
単位$d$次元ユークリッド球のインジケータ関数に対応するナイーブ密度は、密度に基づくクラスタリングアルゴリズムで一般的に使用される。
局所分布特性と滑らかさの異なるデータに適応する新しいカーネル拡散密度関数を提案する。
論文 参考訳(メタデータ) (2021-10-11T09:00:33Z) - A likelihood approach to nonparametric estimation of a singular
distribution using deep generative models [4.329951775163721]
深部生成モデルを用いた特異分布の非パラメトリック推定の可能性について検討する。
我々は、インスタンスノイズでデータを摂動することで、新しい効果的な解が存在することを証明した。
また、より深い生成モデルにより効率的に推定できる分布のクラスを特徴付ける。
論文 参考訳(メタデータ) (2021-05-09T23:13:58Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。