論文の概要: Fast Maximum Likelihood Estimation and Supervised Classification for the
Beta-Liouville Multinomial
- arxiv url: http://arxiv.org/abs/2006.07454v1
- Date: Fri, 12 Jun 2020 20:30:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 03:07:49.805065
- Title: Fast Maximum Likelihood Estimation and Supervised Classification for the
Beta-Liouville Multinomial
- Title(参考訳): Beta-Liouville Multinomial の高速最大値推定と教師付き分類
- Authors: Steven Michael Lakin, Zaid Abdo
- Abstract要約: ベータ・リウヴィル乗算はニュートン・ラフソンの最大推定におけるディリクレ乗算に匹敵する効率であることを示す。
また,4つの金標準データセットのうち2つにおいて,β-Liouville多重項が多重項およびディリクレ多重項よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The multinomial and related distributions have long been used to model
categorical, count-based data in fields ranging from bioinformatics to natural
language processing. Commonly utilized variants include the standard
multinomial and the Dirichlet multinomial distributions due to their
computational efficiency and straightforward parameter estimation process.
However, these distributions make strict assumptions about the mean, variance,
and covariance between the categorical features being modeled. If these
assumptions are not met by the data, it may result in poor parameter estimates
and loss in accuracy for downstream applications like classification. Here, we
explore efficient parameter estimation and supervised classification methods
using an alternative distribution, called the Beta-Liouville multinomial, which
relaxes some of the multinomial assumptions. We show that the Beta-Liouville
multinomial is comparable in efficiency to the Dirichlet multinomial for
Newton-Raphson maximum likelihood estimation, and that its performance on
simulated data matches or exceeds that of the multinomial and Dirichlet
multinomial distributions. Finally, we demonstrate that the Beta-Liouville
multinomial outperforms the multinomial and Dirichlet multinomial on two out of
four gold standard datasets, supporting its use in modeling data with low to
medium class overlap in a supervised classification context.
- Abstract(参考訳): 多項分布と関連する分布は、バイオインフォマティクスから自然言語処理まで、様々な分野の分類、数に基づくデータをモデル化するために長い間使われてきた。
一般的に使用される変種は、計算効率と簡単なパラメータ推定プロセスのために標準多項分布とディリクレ多項分布である。
しかし、これらの分布はモデル化される分類学的特徴の平均、分散、共分散について厳密な仮定を与える。
これらの仮定がデータで満たされない場合、パラメータの見積もりが悪くなり、分類のような下流アプリケーションで精度が低下する可能性がある。
本稿では,多項仮定の一部を緩和するβ-Liouville multinomialと呼ばれる別の分布を用いた効率的なパラメータ推定と教師付き分類法について検討する。
β-liouville multinomial はニュートン-ラフソン最大確率推定のための dirichlet multinomial と同等であり、シミュレーションデータに対する性能は multinomial と dirichlet multinomial distribution と同等かそれ以上である。
最後に、β-liouville multinomialは4つのゴールド標準データセットのうち2つでマルチノマルとディリクレのマルチノマルよりも優れており、教師付き分類コンテキストで低クラスと中クラスが重なり合うモデリングデータでの利用をサポートする。
関連論文リスト
- Hierarchical mixtures of Unigram models for short text clustering: the role of Beta-Liouville priors [1.03590082373586]
本稿では,短いテキストデータの教師なし分類に適した多項混合モデルの変種について述べる。
我々は、ディリクレよりもフレキシブルな相関構造を提供する別の先入観(β-Liouville分布)を探求する。
論文 参考訳(メタデータ) (2024-10-29T08:56:29Z) - Non-asymptotic approximations for Pearson's chi-square statistic and its
application to confidence intervals for strictly convex functions of the
probability weights of discrete distributions [0.0]
多項確率に対する非漸近局所正規近似を開発した。
この結果を用いて離散分布の負エントロピーに対する信頼区間を求める。
論文 参考訳(メタデータ) (2023-09-05T01:18:48Z) - AdaCat: Adaptive Categorical Discretization for Autoregressive Models [84.85102013917606]
AdaCat(Adaptive Categorical Discretization)と呼ばれる,効率的で表現性の高いマルチモーダルパラメータ化を提案する。
AdaCatは自己回帰モデルの各次元を適応的に識別し、モデルが関心の細かい間隔に密度を割り当てることを可能にする。
論文 参考訳(メタデータ) (2022-08-03T17:53:46Z) - Uncertainty Modeling for Out-of-Distribution Generalization [56.957731893992495]
特徴統計を適切に操作することで、ディープラーニングモデルの一般化能力を向上させることができると論じる。
一般的な手法では、特徴統計を学習した特徴から測定された決定論的値とみなすことが多い。
我々は、学習中に合成された特徴統計を用いて、領域シフトの不確かさをモデル化することにより、ネットワークの一般化能力を向上させる。
論文 参考訳(メタデータ) (2022-02-08T16:09:12Z) - Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。
これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文 参考訳(メタデータ) (2021-10-20T12:25:22Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Asymptotically Exact and Fast Gaussian Copula Models for Imputation of
Mixed Data Types [0.13764085113103217]
混合データ型による値の欠落は、多数の機械学習アプリケーションにおいて一般的な問題である。
グスタフソンコプラモデルは確率的枠組みを用いて欠落値の計算を行う手段として提案されている。
ランダム化擬似モンテカルロ法を用いてモデル推定とインプットの両方に直接的および任意的精度の近似を用いた最初の制限に対処する。
論文 参考訳(メタデータ) (2021-02-04T14:42:29Z) - A Class of Conjugate Priors for Multinomial Probit Models which Includes
the Multivariate Normal One [0.3553493344868413]
統一スキュー正規分布(SUN)のクラス全体は、複数の多重項プロビットモデルに共役していることを示す。
後部推論と分類のための最先端の解法を改善する。
論文 参考訳(メタデータ) (2020-07-14T10:08:23Z) - SUMO: Unbiased Estimation of Log Marginal Probability for Latent
Variable Models [80.22609163316459]
無限級数のランダム化トランケーションに基づく潜在変数モデルに対して、ログ境界確率の非バイアス推定器とその勾配を導入する。
推定器を用いてトレーニングしたモデルは、同じ平均計算コストに対して、標準的な重要度サンプリングに基づくアプローチよりも優れたテストセット確率を与えることを示す。
論文 参考訳(メタデータ) (2020-04-01T11:49:30Z) - Review of Probability Distributions for Modeling Count Data [0.0]
一般化線形モデルは回帰文脈におけるカウントの直接モデリングを可能にする。
カウントが相対情報のみを含む場合、マルチノミアルまたはディリクレ・マルチノミカルモデルの方が適切である。
論文 参考訳(メタデータ) (2020-01-10T18:28:19Z) - CatBoostLSS -- An extension of CatBoost to probabilistic forecasting [91.3755431537592]
本稿では,不可変応答変数の条件分布全体を予測する新しいフレームワークを提案する。
CatBoostLSSは条件平均のみではなくパラメトリック分布のすべてのモーメントをモデル化する。
提案手法の利点を実証するシミュレーション研究と実世界の実例を共に提示する。
論文 参考訳(メタデータ) (2020-01-04T15:42:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。