論文の概要: Density estimation with atoms, and functional estimation for mixed discrete-continuous data
- arxiv url: http://arxiv.org/abs/2508.01706v1
- Date: Sun, 03 Aug 2025 10:22:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.022369
- Title: Density estimation with atoms, and functional estimation for mixed discrete-continuous data
- Title(参考訳): 原子による密度推定と混合離散連続データの関数推定
- Authors: Aytijhya Saha, Aaditya Ramdas,
- Abstract要約: 密度汎関数推定では、基底分布がルベーグ測度に関して密度を持つと仮定することが標準である。
データ分布が連続成分と離散成分の混合である場合、結果の手法は理論上矛盾し、実際は不整合である。
我々は、混合物の連続成分の幅広い関数のクラスに対して、既存の推定器を変更する。
- 参考スコア(独自算出の注目度): 29.43493007296859
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In classical density (or density-functional) estimation, it is standard to assume that the underlying distribution has a density with respect to the Lebesgue measure. However, when the data distribution is a mixture of continuous and discrete components, the resulting methods are inconsistent in theory and perform poorly in practice. In this paper, we point out that a minor modification of existing methods for nonparametric density (functional) estimation can allow us to fully remove this assumption while retaining nearly identical theoretical guarantees and improved empirical performance. Our approach is very simple: data points that appear exactly once are likely to originate from the continuous component, whereas repeated observations are indicative of the discrete part. Leveraging this observation, we modify existing estimators for a broad class of functionals of the continuous component of the mixture; this modification is a "wrapper" in the sense that the user can use any underlying method of their choice for continuous density functional estimation. Our modifications deliver consistency without requiring knowledge of the discrete support, the mixing proportion, and without imposing additional assumptions beyond those needed in the absence of the discrete part. Thus, various theorems and existing software packages can be made automatically more robust, with absolutely no additional price when the data is not truly mixed.
- Abstract(参考訳): 古典密度(あるいは密度汎関数)推定において、基底分布がルベーグ測度に関して密度を持つと仮定することは標準である。
しかし、データ分布が連続成分と離散成分の混合成分である場合、結果の手法は理論上不整合であり、実際は不整合である。
本稿では,非パラメトリック密度(機能的)推定のための既存手法の微修正により,ほぼ同一の理論的保証を維持し,経験的性能を向上しつつ,この仮定を完全に取り除くことができることを指摘する。
我々のアプローチは非常に単純で、正確に1回だけ現れるデータポイントは連続成分に由来する可能性が高いが、反復的な観察は離散部分を示す。
この観察を生かして、我々は混合物の連続成分の幅広い種類の機能に対して既存の推定器を修正し、この修正は、連続密度関数推定にユーザが選択した基礎的手法を利用できるという意味で「ラッパー」である。
我々の修正は、離散的な支持や混合比率の知識を必要とせず、また、離散的な部分がない場合に必要となる以上の仮定を課すことなく、一貫性を提供する。
したがって、様々な定理や既存のソフトウェアパッケージは、データが真に混ざっていない場合に全く追加価格なしで、自動的に堅牢にすることができる。
関連論文リスト
- Regulating Model Reliance on Non-Robust Features by Smoothing Input Marginal Density [93.32594873253534]
信頼できる機械学習は、非ロバストな特徴に依存するモデルの厳密な規制を必要とする。
本稿では,モデル予測を入力に関連付けることによって,そのような特徴を記述・規制するフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-05T09:16:56Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Mixed Variational Flows for Discrete Variables [14.00384446902181]
連続的な埋め込みを伴わない離散分布のための変動流ファミリを開発した。
まず、測度保存および離散可逆写像(MAD)を開発し、離散的対象不変性を残した。
また、連立離散モデルおよび連続モデルを扱うMAD Mixの拡張も開発した。
論文 参考訳(メタデータ) (2023-08-29T20:13:37Z) - Sobolev Space Regularised Pre Density Models [51.558848491038916]
本研究では,ソボレフ法則の正則化に基づく非パラメトリック密度推定法を提案する。
この方法は統計的に一貫したものであり、帰納的検証モデルを明確かつ一貫したものにしている。
論文 参考訳(メタデータ) (2023-07-25T18:47:53Z) - Anomaly Detection with Variance Stabilized Density Estimation [49.46356430493534]
本稿では, 観測試料の確率を最大化するための分散安定化密度推定問題を提案する。
信頼性の高い異常検知器を得るために,分散安定化分布を学習するための自己回帰モデルのスペクトルアンサンブルを導入する。
我々は52のデータセットで広範なベンチマークを行い、我々の手法が最先端の結果につながることを示した。
論文 参考訳(メタデータ) (2023-06-01T11:52:58Z) - Copula-Based Density Estimation Models for Multivariate Zero-Inflated
Continuous Data [0.0]
ゼロインフレート連続変数間の多変量相関に対処できる2つのコプラに基づく密度推定モデルを提案する。
ゼロインフレーションデータにおける結び付きデータ問題によるコプラの使用の難しさを克服するために,我々は新しいタイプのコプラ,補正されたガウスコプラを提案する。
論文 参考訳(メタデータ) (2023-04-02T13:43:37Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Nonparametric Probabilistic Regression with Coarse Learners [1.8275108630751844]
我々は, 密度の形状や形状について最小限の仮定で, 正確な条件密度を計算することができることを示す。
このアプローチをさまざまなデータセットで実証し、特に大きなデータセットで競合性能を示す。
論文 参考訳(メタデータ) (2022-10-28T16:25:26Z) - Interpretable Mixture Density Estimation by use of Differentiable
Tree-module [0.0]
解釈可能な木構造を利用した混合密度推定法を提案する。
時間不変情報キャッシュに基づく高速な推論手順は、高速かつ解釈性の両方を達成する。
論文 参考訳(メタデータ) (2021-05-08T07:29:58Z) - Contrastive learning of strong-mixing continuous-time stochastic
processes [53.82893653745542]
コントラスト学習(Contrastive Learning)は、ラベルのないデータから構築された分類タスクを解決するためにモデルを訓練する自己指導型の手法のファミリーである。
拡散の場合,小~中距離間隔の遷移カーネルを適切に構築したコントラスト学習タスクを用いて推定できることが示される。
論文 参考訳(メタデータ) (2021-03-03T23:06:47Z) - Improving Nonparametric Density Estimation with Tensor Decompositions [14.917420021212912]
非パラメトリック密度推定器は、しばしば低次元データに対してよく機能するが、高次元データに適用すると苦しむ。
本稿では、これらの改善が他の単純化された依存前提にまで拡張できるかどうかを考察する。
多次元ヒストグラムにおける低ランク非負のPARAFACやTucker分解に対する推定の制限は、ビン幅速度の次元指数を除去することを示す。
論文 参考訳(メタデータ) (2020-10-06T01:39:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。