論文の概要: Review of Probability Distributions for Modeling Count Data
- arxiv url: http://arxiv.org/abs/2001.04343v1
- Date: Fri, 10 Jan 2020 18:28:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 23:31:15.314914
- Title: Review of Probability Distributions for Modeling Count Data
- Title(参考訳): 数値データモデリングのための確率分布の見直し
- Authors: F. William Townes
- Abstract要約: 一般化線形モデルは回帰文脈におけるカウントの直接モデリングを可能にする。
カウントが相対情報のみを含む場合、マルチノミアルまたはディリクレ・マルチノミカルモデルの方が適切である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Count data take on non-negative integer values and are challenging to
properly analyze using standard linear-Gaussian methods such as linear
regression and principal components analysis. Generalized linear models enable
direct modeling of counts in a regression context using distributions such as
the Poisson and negative binomial. When counts contain only relative
information, multinomial or Dirichlet-multinomial models can be more
appropriate. We review some of the fundamental connections between multinomial
and count models from probability theory, providing detailed proofs. These
relationships are useful for methods development in applications such as topic
modeling of text data and genomics.
- Abstract(参考訳): 非負整数値のカウントデータは、線形回帰や主成分分析のような標準線形ガウス法を用いて適切に解析することが困難である。
一般化線形モデルはポアソンや負二項のような分布を用いた回帰文脈におけるカウントの直接モデリングを可能にする。
カウントが相対情報のみを含む場合、多項モデルやディリクレ多項モデルの方が適切である。
確率論から多重項モデルとカウントモデルとの基本的な関係を概説し、詳細な証明を与える。
これらの関係は、テキストデータやゲノミクスのトピックモデリングのような応用における手法開発に有用である。
関連論文リスト
- Fusion of Gaussian Processes Predictions with Monte Carlo Sampling [61.31380086717422]
科学と工学において、私たちはしばしば興味のある変数の正確な予測のために設計されたモデルで作業します。
これらのモデルが現実の近似であることを認識し、複数のモデルを同じデータに適用し、結果を統合することが望ましい。
論文 参考訳(メタデータ) (2024-03-03T04:21:21Z) - Test Set Sizing Via Random Matrix Theory [91.3755431537592]
本稿ではランダム行列理論の手法を用いて、単純な線形回帰に対して理想的なトレーニング-テストデータ分割を求める。
それは「理想」を整合性計量を満たすものとして定義し、すなわち経験的モデル誤差は実際の測定ノイズである。
本論文は,任意のモデルのトレーニングとテストサイズを,真に最適な方法で解決した最初の論文である。
論文 参考訳(メタデータ) (2021-12-11T13:18:33Z) - Optimal regularizations for data generation with probabilistic graphical
models [0.0]
経験的に、よく調和された正規化スキームは、推論されたモデルの品質を劇的に改善する。
生成的ペアワイドグラフィカルモデルの最大Aポストエリオーリ(MAP)推論におけるL2とL1の正規化について検討する。
論文 参考訳(メタデータ) (2021-12-02T14:45:16Z) - Conjugate priors for count and rounded data regression [0.0]
閉形式後部推論を可能にする共役前部を導入する。
主要な後続関数と予測関数は計算可能であり、直接モンテカルロシミュレーションによって計算可能である。
これらのツールは、線形回帰、基底展開による非線形モデル、モデルと変数選択に広く有用である。
論文 参考訳(メタデータ) (2021-10-23T23:26:01Z) - Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。
これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文 参考訳(メタデータ) (2021-10-20T12:25:22Z) - Nonparametric Functional Analysis of Generalized Linear Models Under
Nonlinear Constraints [0.0]
本稿では、一般化線形モデルのための新しい非パラメトリック方法論を紹介する。
これは二項回帰の強さとカテゴリーデータに対する潜在変数の定式化の強さを組み合わせたものである。
これは最近公開された方法論のパラメトリックバージョンを拡張し、一般化する。
論文 参考訳(メタデータ) (2021-10-11T04:49:59Z) - PSD Representations for Effective Probability Models [117.35298398434628]
最近提案された非負関数に対する正半定値(PSD)モデルがこの目的に特に適していることを示す。
我々はPSDモデルの近似と一般化能力の両方を特徴付け、それらが強い理論的保証を享受していることを示す。
本研究では,PSDモデルの密度推定,決定理論,推論への応用への道を開く。
論文 参考訳(メタデータ) (2021-06-30T15:13:39Z) - Bayesian Inference for Gamma Models [4.189643331553922]
正規分散平均混合の理論を用いて、ガンマ関数を含むモデルに対するデータ拡張スキームを導出する。
本稿では, ガンマ形状推定, 負二項回帰, ディリクレ割り当てなど, 多数の例について考察する。
論文 参考訳(メタデータ) (2021-06-03T14:58:39Z) - Asymptotically Exact and Fast Gaussian Copula Models for Imputation of
Mixed Data Types [0.13764085113103217]
混合データ型による値の欠落は、多数の機械学習アプリケーションにおいて一般的な問題である。
グスタフソンコプラモデルは確率的枠組みを用いて欠落値の計算を行う手段として提案されている。
ランダム化擬似モンテカルロ法を用いてモデル推定とインプットの両方に直接的および任意的精度の近似を用いた最初の制限に対処する。
論文 参考訳(メタデータ) (2021-02-04T14:42:29Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。