論文の概要: Empirical Density Estimation based on Spline Quasi-Interpolation with
applications to Copulas clustering modeling
- arxiv url: http://arxiv.org/abs/2402.11552v1
- Date: Sun, 18 Feb 2024 11:49:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-20 20:18:32.392320
- Title: Empirical Density Estimation based on Spline Quasi-Interpolation with
applications to Copulas clustering modeling
- Title(参考訳): スプライン準補間に基づく経験的密度推定とCopulasクラスタリングモデルへの応用
- Authors: Cristiano Tamborrino, Antonella Falini, Francesca Mazzia
- Abstract要約: 密度推定は、様々な分野において、基礎となるデータの分布をモデル化し理解するための基礎的な手法である。
本稿では,擬似補間による密度の単変量近似を提案する。
提案アルゴリズムは人工データセットと実データセットで検証される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Density estimation is a fundamental technique employed in various fields to
model and to understand the underlying distribution of data. The primary
objective of density estimation is to estimate the probability density function
of a random variable. This process is particularly valuable when dealing with
univariate or multivariate data and is essential for tasks such as clustering,
anomaly detection, and generative modeling. In this paper we propose the
mono-variate approximation of the density using spline quasi interpolation and
we applied it in the context of clustering modeling. The clustering technique
used is based on the construction of suitable multivariate distributions which
rely on the estimation of the monovariate empirical densities (marginals). Such
an approximation is achieved by using the proposed spline quasi-interpolation,
while the joint distributions to model the sought clustering partition is
constructed with the use of copulas functions. In particular, since copulas can
capture the dependence between the features of the data independently from the
marginal distributions, a finite mixture copula model is proposed. The
presented algorithm is validated on artificial and real datasets.
- Abstract(参考訳): 密度推定は、様々な分野において、基礎となるデータの分布をモデル化し理解するための基礎技術である。
密度推定の主な目的は、確率変数の確率密度関数を推定することである。
このプロセスは、非変量データや多変量データを扱う際に特に有用であり、クラスタリング、異常検出、生成モデリングといったタスクに必須である。
本稿では,スプライン準補間を用いた密度の単変量近似を提案し,クラスタリングモデリングの文脈で適用した。
クラスタリング手法は, 単変量経験密度 (marginals) の推定に依存する適切な多変量分布の構築に基づいている。
このような近似は、提案したスプライン準補間を用いて達成され、探索されたクラスタリング分割をモデル化する結合分布はコプラ関数を用いて構成される。
特に、コプラは限界分布とは独立にデータの特徴間の依存性を捉えることができるため、有限混合コプラモデルが提案されている。
提案アルゴリズムは人工データセットと実データセットで検証される。
関連論文リスト
- Statistical Modeling of Univariate Multimodal Data [0.0]
そこで本研究では,一助データを一助部分集合に分割する手法を提案する。
谷点検出には, 経験的累積密度関数の凸船体上の臨界点の特性を導入する。
次に、得られた各ユニモーダル部分集合に対する統計モデルを提供するユニモーダルデータモデリング手法を適用する。
論文 参考訳(メタデータ) (2024-12-20T13:49:15Z) - Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - PQMass: Probabilistic Assessment of the Quality of Generative Models
using Probability Mass Estimation [8.527898482146103]
生成モデルの品質を評価するための包括的サンプルベース手法を提案する。
提案手法により,同じ分布から2組のサンプルが引き出される確率を推定できる。
論文 参考訳(メタデータ) (2024-02-06T19:39:26Z) - Finite Mixtures of Multivariate Poisson-Log Normal Factor Analyzers for
Clustering Count Data [0.8499685241219366]
因子分析モデルの混合に基づく8種類の擬似混合モデルについて紹介する。
提案モデルはRNAシークエンシング研究から得られた離散的なデータをクラスタリングする文脈において探索される。
論文 参考訳(メタデータ) (2023-11-13T21:23:15Z) - Copula-Based Density Estimation Models for Multivariate Zero-Inflated
Continuous Data [0.0]
ゼロインフレート連続変数間の多変量相関に対処できる2つのコプラに基づく密度推定モデルを提案する。
ゼロインフレーションデータにおける結び付きデータ問題によるコプラの使用の難しさを克服するために,我々は新しいタイプのコプラ,補正されたガウスコプラを提案する。
論文 参考訳(メタデータ) (2023-04-02T13:43:37Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Density-Based Clustering with Kernel Diffusion [59.4179549482505]
単位$d$次元ユークリッド球のインジケータ関数に対応するナイーブ密度は、密度に基づくクラスタリングアルゴリズムで一般的に使用される。
局所分布特性と滑らかさの異なるデータに適応する新しいカーネル拡散密度関数を提案する。
論文 参考訳(メタデータ) (2021-10-11T09:00:33Z) - A likelihood approach to nonparametric estimation of a singular
distribution using deep generative models [4.329951775163721]
深部生成モデルを用いた特異分布の非パラメトリック推定の可能性について検討する。
我々は、インスタンスノイズでデータを摂動することで、新しい効果的な解が存在することを証明した。
また、より深い生成モデルにより効率的に推定できる分布のクラスを特徴付ける。
論文 参考訳(メタデータ) (2021-05-09T23:13:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。