論文の概要: On Large-Scale Dynamic Topic Modeling with Nonnegative CP Tensor
Decomposition
- arxiv url: http://arxiv.org/abs/2001.00631v2
- Date: Thu, 15 Oct 2020 00:02:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 03:54:11.947783
- Title: On Large-Scale Dynamic Topic Modeling with Nonnegative CP Tensor
Decomposition
- Title(参考訳): 非負cpテンソル分解による大規模動的トピックモデリングについて
- Authors: Miju Ahn, Nicole Eikmeier, Jamie Haddock, Lara Kassab, Alona
Kryshchenko, Kathryn Leonard, Deanna Needell, R. W. M. A. Madushani, Elena
Sizikova, Chuntian Wang
- Abstract要約: 非負のCANDECOMP/PARAPACテンソル分解法(NNCPD)を提案し、データテンソルを直接非負ベクトルの外積の最小の和に分解する。
NNCPDの有効性は、合成データと実データの両方に適用することで示され、その結果は大幅に改善された。
- 参考スコア(独自算出の注目度): 6.6982725129026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is currently an unprecedented demand for large-scale temporal data
analysis due to the explosive growth of data. Dynamic topic modeling has been
widely used in social and data sciences with the goal of learning latent topics
that emerge, evolve, and fade over time. Previous work on dynamic topic
modeling primarily employ the method of nonnegative matrix factorization (NMF),
where slices of the data tensor are each factorized into the product of
lower-dimensional nonnegative matrices. With this approach, however,
information contained in the temporal dimension of the data is often neglected
or underutilized. To overcome this issue, we propose instead adopting the
method of nonnegative CANDECOMP/PARAPAC (CP) tensor decomposition (NNCPD),
where the data tensor is directly decomposed into a minimal sum of outer
products of nonnegative vectors, thereby preserving the temporal information.
The viability of NNCPD is demonstrated through application to both synthetic
and real data, where significantly improved results are obtained compared to
those of typical NMF-based methods. The advantages of NNCPD over such
approaches are studied and discussed. To the best of our knowledge, this is the
first time that NNCPD has been utilized for the purpose of dynamic topic
modeling, and our findings will be transformative for both applications and
further developments.
- Abstract(参考訳): 現在、データの爆発的な成長により、大規模な時間データ分析に対する前例のない需要がある。
動的トピックモデリングは、時間とともに出現し、進化し、消滅する潜在トピックを学ぶことを目的として、社会科学やデータサイエンスで広く使われている。
動的トピックモデリングにおける従来の研究は主に非負行列分解法(NMF)を用いており、データテンソルのスライスはそれぞれ低次元非負行列の積に分解される。
しかし、このアプローチでは、データの時間次元に含まれる情報は、しばしば無視されるか、使われない。
この問題を解決するために、データテンソルを直接非負ベクトルの外積の最小和に分解し、時間情報を保存する非負のCANDECOMP/PARAPACテンソル分解法(NNCPD)を採用することを提案する。
NNCPDの有効性は、合成データと実データの両方に適用することで示され、典型的なNMF法と比較して大幅に改善された結果が得られる。
このようなアプローチに対するncpdの利点を考察し考察した。
我々の知る限り、NNCPDが動的トピックモデリングの目的に利用されたのはこれが初めてであり、我々の発見はアプリケーションとさらなる開発の両方に変革をもたらすだろう。
関連論文リスト
- Multi-Head Self-Attending Neural Tucker Factorization [5.734615417239977]
本稿では,高次元および不完全(HDI)テンソルの学習表現に適したニューラルネットワークに基づくテンソル分解手法を提案する。
提案したMSNTucFモデルでは,観測結果の欠落を推定する上で,最先端のベンチマークモデルと比較して優れた性能を示す。
論文 参考訳(メタデータ) (2025-01-16T13:04:15Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Coseparable Nonnegative Tensor Factorization With T-CUR Decomposition [2.013220890731494]
非負行列因子化(NMF)は、データから意味のある特徴を抽出する重要な教師なし学習手法である。
本研究では,コセプタブルコアを選択するための交互選択法を提案する。
その結果, 分離可能なNMFと比較して, 分離可能なNTFの有効性が示された。
論文 参考訳(メタデータ) (2024-01-30T09:22:37Z) - A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - A Momentum-Incorporated Non-Negative Latent Factorization of Tensors
Model for Dynamic Network Representation [0.0]
大規模動的ネットワーク (LDN) は、多くのビッグデータ関連アプリケーションにおけるデータソースである。
テンソル(LFT)モデルの潜在因子化は、この時間パターンを効率的に抽出する。
勾配降下(SGD)解法に基づくLFTモデルは、トレーニングスキームによって制限されることが多く、尾収束が弱い。
本稿では,運動量付きSGDに基づく非線形LFTモデル(MNNL)を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:30:53Z) - FaDIn: Fast Discretized Inference for Hawkes Processes with General
Parametric Kernels [82.53569355337586]
この研究は、有限なサポートを持つ一般パラメトリックカーネルを用いた時間点プロセス推論の効率的な解を提供する。
脳磁図(MEG)により記録された脳信号からの刺激誘発パターンの発生をモデル化し,その有効性を評価する。
その結果,提案手法により,最先端技術よりもパターン遅延の推定精度が向上することが示唆された。
論文 参考訳(メタデータ) (2022-10-10T12:35:02Z) - Extension of Dynamic Mode Decomposition for dynamic systems with
incomplete information based on t-model of optimal prediction [69.81996031777717]
動的モード分解は、動的データを研究するための非常に効率的な手法であることが証明された。
このアプローチの適用は、利用可能なデータが不完全である場合に問題となる。
本稿では,森-Zwanzig分解の1次近似を考察し,対応する最適化問題を記述し,勾配に基づく最適化法を用いて解く。
論文 参考訳(メタデータ) (2022-02-23T11:23:59Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Low-rank statistical finite elements for scalable model-data synthesis [0.8602553195689513]
statFEMは、支配方程式に強制を埋め込むことによって、事前モデルの誤特定を認める。
この方法は、観測されたデータ生成過程を最小限の情報損失で再構築する。
本稿では、下層の密度共分散行列の低ランク近似を埋め込むことで、このハードルを克服する。
論文 参考訳(メタデータ) (2021-09-10T09:51:43Z) - Efficient Multidimensional Functional Data Analysis Using Marginal
Product Basis Systems [2.4554686192257424]
多次元関数データのサンプルから連続表現を学習するためのフレームワークを提案する。
本研究では, テンソル分解により, 得られた推定問題を効率的に解けることを示す。
我々は、ニューロイメージングにおける真のデータ応用で締めくくっている。
論文 参考訳(メタデータ) (2021-07-30T16:02:15Z) - Two-Dimensional Semi-Nonnegative Matrix Factorization for Clustering [50.43424130281065]
TS-NMFと呼ばれる2次元(2次元)データに対する新しい半負行列分解法を提案する。
前処理ステップで2次元データをベクトルに変換することで、データの空間情報に深刻なダメージを与える既存の手法の欠点を克服する。
論文 参考訳(メタデータ) (2020-05-19T05:54:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。