論文の概要: Symbolic Density Estimation for Discrete Distributions
- arxiv url: http://arxiv.org/abs/2605.21813v1
- Date: Wed, 20 May 2026 23:22:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.025763
- Title: Symbolic Density Estimation for Discrete Distributions
- Title(参考訳): 離散分布の記号密度推定
- Authors: Ziwen Liu, Meng Li,
- Abstract要約: 閉形式確率質量関数を自動的に復元する教師なしフレームワークである記号密度推定(SDE)を導入する。
提案手法は,ドメイン固有の構造的前提を進化探索と妥当性を考慮した推論段階と統合する。
実際のデータアプリケーションは、標準モデルよりも適合性を改善するための簡潔で解釈可能な混合モデルを特定することを示している。
- 参考スコア(独自算出の注目度): 5.337523703846813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discrete probability laws underpin statistical modeling, yet the catalog of interpretable distributions has expanded only gradually through centuries of case-by-case mathematical derivations. We introduce symbolic density estimation (SDE), an unsupervised framework that automatically recovers closed-form probability mass functions by composing elementary analytic operations within a structured search space. Our method integrates domain-specific structural priors with evolutionary search and a validity-aware inference stage, and it extends to richer distribution families such as zero inflation and finite mixtures. To support systematic evaluation and future research, we contribute a benchmark dataset spanning a broad collection of commonly used discrete distributions. The proposed algorithm recovers all benchmark families with accurate parameter estimates. A real data application shows that it identifies concise and interpretable mixture models that improve goodness-of-fit over standard models.
- Abstract(参考訳): 離散確率法則は統計的モデリングの基盤となっているが、解釈可能な分布のカタログは、ケース・バイ・ケースの数学的導出の何世紀にもわたって徐々に拡大してきた。
構造化された探索空間内の基本解析操作を構成することにより、閉形式確率質量関数を自動的に復元する、教師なしのフレームワークである記号密度推定(SDE)を導入する。
提案手法は, ドメイン固有の構造的前提と進化探索, 妥当性を考慮した推論段階を統合し, ゼロインフレーションや有限混合など, よりリッチな分布系に拡張する。
系統的評価と今後の研究を支援するために,広く使用されている離散分布の広範囲にわたるベンチマークデータセットを寄贈する。
提案アルゴリズムは、正確なパラメータ推定で全てのベンチマークファミリを復元する。
実際のデータアプリケーションは、標準モデルよりも適合性を改善するための簡潔で解釈可能な混合モデルを特定することを示している。
関連論文リスト
- Diffusion Model for Manifold Data: Score Decomposition, Curvature, and Statistical Complexity [93.52679474816728]
拡散モデルは、生成モデリングにおける主要なフレームワークとなっている。
本稿では,拡散モデルが構造データをどのように学習するかを,統計的複雑性とデータ幾何学的性質の影響の2つの重要な側面に焦点をあてる。
また、スコア関数の構造と多様体曲率の相互作用も強調する。
論文 参考訳(メタデータ) (2026-03-21T04:40:19Z) - Model averaging in the space of probability distributions [0.0]
ワッサーシュタイン距離の観点から,確率分布空間におけるアグリゲーションスキームについて検討した。
標準弾性ネットのペナル化を動機とする正則化スキームを用いて, 空間特性を享受するモデルが連続的に得られることを示す。
提案手法は,クレームサイズ分布と関連するテールリスクを推定するために,現実の保険損失のデータセットに適用される。
論文 参考訳(メタデータ) (2025-07-15T20:41:57Z) - Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - Generative Assignment Flows for Representing and Learning Joint Distributions of Discrete Data [2.6499018693213316]
離散確率変数の結合確率分布の表現のための新しい生成モデルを提案する。
このアプローチでは、分解分布の統計部分多様体上のランダム化代入フローによる測度輸送を用いる。
論文 参考訳(メタデータ) (2024-06-06T21:58:33Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Distributional Gradient Boosting Machines [77.34726150561087]
私たちのフレームワークはXGBoostとLightGBMをベースにしています。
我々は,このフレームワークが最先端の予測精度を実現することを示す。
論文 参考訳(メタデータ) (2022-04-02T06:32:19Z) - A likelihood approach to nonparametric estimation of a singular
distribution using deep generative models [4.329951775163721]
深部生成モデルを用いた特異分布の非パラメトリック推定の可能性について検討する。
我々は、インスタンスノイズでデータを摂動することで、新しい効果的な解が存在することを証明した。
また、より深い生成モデルにより効率的に推定できる分布のクラスを特徴付ける。
論文 参考訳(メタデータ) (2021-05-09T23:13:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。