論文の概要: Testing Hypotheses of Covariate Effects on Topics of Discourse
- arxiv url: http://arxiv.org/abs/2506.05570v1
- Date: Thu, 05 Jun 2025 20:28:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.225731
- Title: Testing Hypotheses of Covariate Effects on Topics of Discourse
- Title(参考訳): 談話の話題に対する共変量の影響の検証
- Authors: Gabriel Phelan, David A. Campbell,
- Abstract要約: 本稿では,大きなテキストコーパスの面から抽出可能なトピックモデリング手法を提案する。
これは、基礎となる確率モデルにおけるパラメータ推定の役割を強調することで達成される。
ここで提唱される単純で非パラメトリックなアプローチは、より速く、より解釈可能であり、上記の生成モデルよりも推論の正当性を享受する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce an approach to topic modelling with document-level covariates that remains tractable in the face of large text corpora. This is achieved by de-emphasizing the role of parameter estimation in an underlying probabilistic model, assuming instead that the data come from a fixed but unknown distribution whose statistical functionals are of interest. We propose combining a convex formulation of non-negative matrix factorization with standard regression techniques as a fast-to-compute and useful estimate of such a functional. Uncertainty quantification can then be achieved by reposing non-parametric resampling methods on top of this scheme. This is in contrast to popular topic modelling paradigms, which posit a complex and often hard-to-fit generative model of the data. We argue that the simple, non-parametric approach advocated here is faster, more interpretable, and enjoys better inferential justification than said generative models. Finally, our methods are demonstrated with an application analysing covariate effects on discourse of flavours attributed to Canadian beers.
- Abstract(参考訳): 本稿では,大規模テキストコーパスの面から抽出可能な文書レベルの共変量を用いたトピックモデリング手法を提案する。
これは、統計関数が興味を持つ固定的だが未知の分布から得られると仮定して、基礎となる確率モデルにおけるパラメータ推定の役割を非強調にすることで達成される。
本稿では,非負行列分解の凸定式化と標準回帰法を組み合わせることを提案する。
不確かさの定量化は、このスキームの上に非パラメトリック再サンプリング法を再現することで達成できる。
これは一般的なトピックモデリングパラダイムとは対照的であり、データの複雑で、しばしば適合する生成モデルを示す。
ここで提唱される単純で非パラメトリックなアプローチは、より速く、より解釈可能であり、上記の生成モデルよりも推論の正当性を享受する。
最後に,カナダビール由来の香辛料の談話に対する共変量の影響を分析した。
関連論文リスト
- Simulation-based inference for stochastic nonlinear mixed-effects models with applications in systems biology [0.29998889086656577]
階層型混合効果モデルにおける拡張ベイズ推定のための新しい手法を提案する。
我々のフレームワークはまず、確率と後部分布の補正近似を構築し、各データセットに対して高速に精製する。
統計的精度の点で,我々のアプローチは迅速かつ競争的であった。
論文 参考訳(メタデータ) (2025-04-15T15:18:58Z) - Estimating Causal Effects from Learned Causal Networks [56.14597641617531]
本稿では、離散可観測変数に対する因果影響クエリに応答する代替パラダイムを提案する。
観測データから直接因果ベイズネットワークとその共起潜伏変数を学習する。
本手法は, 推定手法よりも有効であることを示す。
論文 参考訳(メタデータ) (2024-08-26T08:39:09Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Nonparametric Functional Analysis of Generalized Linear Models Under
Nonlinear Constraints [0.0]
本稿では、一般化線形モデルのための新しい非パラメトリック方法論を紹介する。
これは二項回帰の強さとカテゴリーデータに対する潜在変数の定式化の強さを組み合わせたものである。
これは最近公開された方法論のパラメトリックバージョンを拡張し、一般化する。
論文 参考訳(メタデータ) (2021-10-11T04:49:59Z) - Low-rank statistical finite elements for scalable model-data synthesis [0.8602553195689513]
statFEMは、支配方程式に強制を埋め込むことによって、事前モデルの誤特定を認める。
この方法は、観測されたデータ生成過程を最小限の情報損失で再構築する。
本稿では、下層の密度共分散行列の低ランク近似を埋め込むことで、このハードルを克服する。
論文 参考訳(メタデータ) (2021-09-10T09:51:43Z) - Convex Latent Effect Logit Model via Sparse and Low-rank Decomposition [2.1915057426589746]
本稿では,ロジスティック回帰モデル(logit)を学習するための凸パラメトリック凸パラメトリック定式化を提案する。
その人気にもかかわらず、個別の不均一性を学ぶための混合ロジットアプローチにはいくつかの欠点がある。
論文 参考訳(メタデータ) (2021-08-22T22:23:39Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Slice Sampling for General Completely Random Measures [74.24975039689893]
本稿では, 後続推定のためのマルコフ連鎖モンテカルロアルゴリズムについて, 補助スライス変数を用いてトランケーションレベルを適応的に設定する。
提案アルゴリズムの有効性は、いくつかの一般的な非パラメトリックモデルで評価される。
論文 参考訳(メタデータ) (2020-06-24T17:53:53Z) - Efficient Ensemble Model Generation for Uncertainty Estimation with
Bayesian Approximation in Segmentation [74.06904875527556]
アンサンブルセグメンテーションモデルを構築するための汎用的で効率的なセグメンテーションフレームワークを提案する。
提案手法では,層選択法を用いて効率よくアンサンブルモデルを生成することができる。
また,新たな画素単位の不確実性損失を考案し,予測性能を向上する。
論文 参考訳(メタデータ) (2020-05-21T16:08:38Z) - Predicting Multidimensional Data via Tensor Learning [0.0]
本研究では,本データセットの内在的多次元構造を保持するモデルを開発する。
モデルパラメータを推定するために、オルタネート・リースト・スクエアスアルゴリズムを開発した。
提案モデルは,予測文献に存在するベンチマークモデルより優れている。
論文 参考訳(メタデータ) (2020-02-11T11:57:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。