論文の概要: Topic Analysis with Side Information: A Neural-Augmented LDA Approach
- arxiv url: http://arxiv.org/abs/2510.24918v1
- Date: Tue, 28 Oct 2025 19:38:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:44.708097
- Title: Topic Analysis with Side Information: A Neural-Augmented LDA Approach
- Title(参考訳): 側面情報を用いたトピック分析:ニューラル拡張LDAアプローチ
- Authors: Biyi Fang, Kripa Rajshekhar, Truong Vo, Diego Klabjan,
- Abstract要約: 本稿では,ニューラル先行機構を通じて側情報を組み込んだニューラル拡張確率的トピックモデルを提案する。
nnLDA は LDA と Dirichlet-Multinomial Regression を、トピックコヒーレンス、パープレキシティ、分布、下流分類において一貫して上回っている。
- 参考スコア(独自算出の注目度): 16.477230727313017
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional topic models such as Latent Dirichlet Allocation (LDA) have been widely used to uncover latent structures in text corpora, but they often struggle to integrate auxiliary information such as metadata, user attributes, or document labels. These limitations restrict their expressiveness, personalization, and interpretability. To address this, we propose nnLDA, a neural-augmented probabilistic topic model that dynamically incorporates side information through a neural prior mechanism. nnLDA models each document as a mixture of latent topics, where the prior over topic proportions is generated by a neural network conditioned on auxiliary features. This design allows the model to capture complex nonlinear interactions between side information and topic distributions that static Dirichlet priors cannot represent. We develop a stochastic variational Expectation-Maximization algorithm to jointly optimize the neural and probabilistic components. Across multiple benchmark datasets, nnLDA consistently outperforms LDA and Dirichlet-Multinomial Regression in topic coherence, perplexity, and downstream classification. These results highlight the benefits of combining neural representation learning with probabilistic topic modeling in settings where side information is available.
- Abstract(参考訳): ラテント・ディリクレ・アロケーション(LDA)のような伝統的なトピックモデルはテキストコーパスの潜在構造を明らかにするために広く用いられてきたが、メタデータやユーザ属性、ドキュメントラベルといった補助的な情報の統合に苦慮することが多い。
これらの制限は表現性、パーソナライゼーション、解釈可能性を制限する。
これを解決するために,ニューラル先行機構を通じてサイド情報を動的に組み込むニューラル拡張確率的トピックモデルnnLDAを提案する。
nnLDAは、各ドキュメントを潜在トピックの混合としてモデル化し、先行するトピックの比率は補助的特徴を条件としたニューラルネットワークによって生成される。
この設計により、静的ディリクレ事前表現できないサイド情報とトピック分布の間の複雑な非線形相互作用を捉えることができる。
確率的変動予測最大化アルゴリズムを開発し、ニューラルネットワークと確率的コンポーネントを協調的に最適化する。
複数のベンチマークデータセット全体で、nnLDAは、トピックコヒーレンス、パープレキシティ、下流分類において、LDAとDirichlet-Multinomial Regressionを一貫して上回っている。
これらの結果は、サイド情報が利用可能な設定において、ニューラル表現学習と確率論的トピックモデリングを組み合わせる利点を強調している。
関連論文リスト
- Information-theoretic Quantification of High-order Feature Effects in Classification Problems [0.19791587637442676]
特徴重要度(Hi-Fi)法における高次相互作用の情報理論拡張について述べる。
私たちのフレームワークは、機能のコントリビューションをユニークでシナジスティックで冗長なコンポーネントに分解します。
その結果,提案した推定器は理論的および予測された結果を正確に復元することがわかった。
論文 参考訳(メタデータ) (2025-07-06T11:50:30Z) - TokenUnify: Scaling Up Autoregressive Pretraining for Neuron Segmentation [65.65530016765615]
本稿では,3つの相補的な学習目標を通じて,大規模依存関係をキャプチャする階層型予測コーディングフレームワークを提案する。
TokenUnifyは、ランダムトークン予測、次のトークン予測、およびすべてのトークン予測を統合して、包括的な表現空間を作成する。
また,120億個の注釈付きボクセルを付加した大規模EMデータセットを導入し,空間連続性を持つ理想的な長周期視覚データを提供する。
論文 参考訳(メタデータ) (2024-05-27T05:45:51Z) - Improving Neural Additive Models with Bayesian Principles [54.29602161803093]
ニューラル加算モデル(NAM)は、個別の加算サブネットワークでキャリブレーションされた入力特徴を扱うことにより、ディープニューラルネットワークの透明性を高める。
本研究では,Laplace-approximated NAM (LA-NAMs) を開発した。
論文 参考訳(メタデータ) (2023-05-26T13:19:15Z) - Neural Dynamic Focused Topic Model [2.9005223064604078]
ニューラル変動推論の最近の進歩を活用し、ダイナミックフォーカストピックモデルに代替的なニューラルアプローチを提案する。
本稿では,Bernoulli確率変数の列を利用してトピックの出現を追跡するトピック進化のためのニューラルモデルを開発する。
論文 参考訳(メタデータ) (2023-01-26T08:37:34Z) - Neural Topic Modeling with Deep Mutual Information Estimation [23.474848535821994]
本稿では,深い相互情報推定を取り入れたニューラルトピックモデルを提案する。
NTM-DMIEはトピック学習のためのニューラルネットワーク手法である。
我々はNTM-DMIEをテキストクラスタリングの精度、トピック表現、トピック一意性、トピックコヒーレンスなどの指標で評価する。
論文 参考訳(メタデータ) (2022-03-12T01:08:10Z) - Topic Analysis for Text with Side Data [18.939336393665553]
本稿では,ニューラルネットワークと潜在トピックモデルを組み合わせたハイブリッド生成確率モデルを提案する。
モデルでは、各文書は、基礎となるトピックの集合上の有限混合としてモデル化される。
各トピックは、基礎となるトピック確率の集合上の無限混合としてモデル化される。
論文 参考訳(メタデータ) (2022-03-01T22:06:30Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - Generative Counterfactuals for Neural Networks via Attribute-Informed
Perturbation [51.29486247405601]
AIP(Attribute-Informed Perturbation)の提案により,生データインスタンスの反事実を生成するフレームワークを設計する。
異なる属性を条件とした生成モデルを利用することで、所望のラベルとの反事実を効果的かつ効率的に得ることができる。
実世界のテキストや画像に対する実験結果から, 設計したフレームワークの有効性, サンプル品質, および効率が示された。
論文 参考訳(メタデータ) (2021-01-18T08:37:13Z) - Semi-Structured Deep Piecewise Exponential Models [2.7728956081909346]
本稿では,統計学の先進的な概念と深層学習を組み合わせた生存分析のための多目的フレームワークを提案する。
この枠組みを用いてアルツハイマー病の進行を予測することによって概念実証を行う。
論文 参考訳(メタデータ) (2020-11-11T14:41:19Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。