論文の概要: S2WTM: Spherical Sliced-Wasserstein Autoencoder for Topic Modeling
- arxiv url: http://arxiv.org/abs/2507.12451v1
- Date: Wed, 16 Jul 2025 17:47:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.506072
- Title: S2WTM: Spherical Sliced-Wasserstein Autoencoder for Topic Modeling
- Title(参考訳): S2WTM: トピーモデリングのための球スライスワッセルシュタインオートエンコーダ
- Authors: Suman Adhya, Debarshi Kumar Sanyal,
- Abstract要約: 変分自己エンコーダに基づくニューラルトピックモデル(VAE-NTMs)は、超球面構造を符号化する前に一般的にフォン・ミセス・フィッシャーを採用する。
VAE-NTMは、目的関数におけるKLの発散項が著しく減少する後部崩壊に苦しむことが多い。
トピックモデリングのための球スライスワッサースタインオートエンコーダ(S2WTM)を提案する。
- 参考スコア(独自算出の注目度): 0.8962460460173959
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modeling latent representations in a hyperspherical space has proven effective for capturing directional similarities in high-dimensional text data, benefiting topic modeling. Variational autoencoder-based neural topic models (VAE-NTMs) commonly adopt the von Mises-Fisher prior to encode hyperspherical structure. However, VAE-NTMs often suffer from posterior collapse, where the KL divergence term in the objective function highly diminishes, leading to ineffective latent representations. To mitigate this issue while modeling hyperspherical structure in the latent space, we propose the Spherical Sliced Wasserstein Autoencoder for Topic Modeling (S2WTM). S2WTM employs a prior distribution supported on the unit hypersphere and leverages the Spherical Sliced-Wasserstein distance to align the aggregated posterior distribution with the prior. Experimental results demonstrate that S2WTM outperforms state-of-the-art topic models, generating more coherent and diverse topics while improving performance on downstream tasks.
- Abstract(参考訳): 超球面空間における潜在表現のモデリングは、高次元テキストデータの方向類似性を捉えるのに有効であることが証明された。
変分自己エンコーダに基づくニューラルトピックモデル(VAE-NTMs)は、超球面構造を符号化する前に一般的にフォン・ミセス・フィッシャーを採用する。
しかしながら、VAE-NTMは、目的関数におけるKLの発散項が著しく減少し、非効率な潜伏表現をもたらす後部崩壊に悩まされることが多い。
潜時空間における超球面構造をモデル化しながらこの問題を軽減するため,S2WTM(Spherical Sliced Wasserstein Autoencoder for Topic Modeling)を提案する。
S2WTMは、単位超球面上で支持される事前分布を採用し、球状スライス-ワッサーシュタイン距離を利用して、集約された後部分布を前と整列させる。
実験により、S2WTMは最先端トピックモデルより優れ、より一貫性があり多様なトピックを生成しながら、下流タスクの性能を改善していることが示された。
関連論文リスト
- Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model [1.9746060146273674]
本稿では,新しい言語インフォームドハイパースペクトル画像合成法であるTxt2HSI-LDM(VAE)を提案する。
ハイパースペクトルデータの高次元性に対処するため、普遍変分オートエンコーダ(VAE)は、データを低次元の潜在空間にマッピングするように設計されている。
VAEは、拡散モデルによって生成された潜時空間から言語条件を入力としてHSIをデコードする。
論文 参考訳(メタデータ) (2025-02-27T02:35:49Z) - Stochastic Reconstruction of Gappy Lagrangian Turbulent Signals by Conditional Diffusion Models [1.7810134788247751]
本研究では, 乱流によって受動的に対流する小物体の軌道に沿って, 空間・速度の欠落を再現する手法を提案する。
近年提案されているデータ駆動機械学習技術である条件付き生成拡散モデルを利用する。
論文 参考訳(メタデータ) (2024-10-31T14:26:10Z) - KFD-NeRF: Rethinking Dynamic NeRF with Kalman Filter [49.85369344101118]
KFD-NeRFは,Kalmanフィルタに基づく効率的かつ高品質な運動再構成フレームワークと統合された,新しい動的ニューラル放射場である。
我々のキーとなる考え方は、動的放射場を、観測と予測という2つの知識源に基づいて時間的に異なる状態が推定される動的システムとしてモデル化することである。
我々のKFD-NeRFは、同等の計算時間と最先端の視線合成性能で、徹底的な訓練を施した類似または優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-18T05:48:24Z) - AROMA: Preserving Spatial Structure for Latent PDE Modeling with Local Neural Fields [14.219495227765671]
本稿では、局所的なニューラルネットワークを用いた偏微分方程式(PDE)のモデリングを強化するためのフレームワークであるAROMAを提案する。
我々のフレキシブルエンコーダ・デコーダアーキテクチャは、様々なデータタイプから空間物理場のスムーズな遅延表現を得ることができる。
拡散型定式化を用いることで、従来のMSEトレーニングと比較して安定性が向上し、ロールアウトが長くなる。
論文 参考訳(メタデータ) (2024-06-04T10:12:09Z) - Generative Modeling with Phase Stochastic Bridges [49.4474628881673]
拡散モデル(DM)は、連続入力のための最先端の生成モデルを表す。
我々はtextbfphase space dynamics に基づく新しい生成モデリングフレームワークを提案する。
我々のフレームワークは、動的伝播の初期段階において、現実的なデータポイントを生成する能力を示す。
論文 参考訳(メタデータ) (2023-10-11T18:38:28Z) - Complexity Matters: Rethinking the Latent Space for Generative Modeling [65.64763873078114]
生成的モデリングにおいて、多くの成功したアプローチは、例えば安定拡散のような低次元の潜在空間を利用する。
本研究では, モデル複雑性の観点から潜在空間を再考することにより, 未探索の話題に光を当てることを目的としている。
論文 参考訳(メタデータ) (2023-07-17T07:12:29Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Modeling the space-time correlation of pulsed twin beams [68.8204255655161]
パラメトリックダウンコンバージョンによって生成される絡み合ったツインビームは、画像指向アプリケーションで好まれるソースである。
本研究では,時間消費数値シミュレーションと非現実的な平面波ポンプ理論のギャップを埋めることを目的とした半解析モデルを提案する。
論文 参考訳(メタデータ) (2023-01-18T11:29:49Z) - Data-driven low-dimensional dynamic model of Kolmogorov flow [0.0]
流れのダイナミクスを捉える低次モデル (ROM) はシミュレーションの計算コストの削減に重要である。
この研究は、フローのダイナミクスと特性を効果的にキャプチャする最小次元モデルのためのデータ駆動フレームワークを示す。
我々はこれをカオス的かつ断続的な行動からなる体制におけるコルモゴロフ流に適用する。
論文 参考訳(メタデータ) (2022-10-29T23:05:39Z) - Hyperbolic Variational Graph Neural Network for Modeling Dynamic Graphs [77.33781731432163]
我々は,ノード表現の推論を目的とした双曲空間における動的グラフ表現を初めて学習する。
本稿では,HVGNNと呼ばれる新しいハイパーボリック変動グラフネットワークを提案する。
特に,動力学をモデル化するために,理論的に接地した時間符号化手法に基づく時間gnn(tgnn)を導入する。
論文 参考訳(メタデータ) (2021-04-06T01:44:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。