論文の概要: Interpretable Topic Extraction and Word Embedding Learning using row-stochastic DEDICOM
- arxiv url: http://arxiv.org/abs/2507.16695v1
- Date: Tue, 22 Jul 2025 15:30:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:14.182915
- Title: Interpretable Topic Extraction and Word Embedding Learning using row-stochastic DEDICOM
- Title(参考訳): 行確率DDICOMを用いた解釈可能なトピック抽出と単語埋め込み学習
- Authors: Lars Hillebrand, David Biesner, Christian Bauckhage, Rafet Sifa,
- Abstract要約: テキストコーパスのポイントワイド相互情報行列にDEDICOMの行確率変化を導入し、潜在トピッククラスタを同定する。
本稿では,制約付きDEDICOMアルゴリズムを効率的に学習する手法と,そのトピックモデリングと単語埋め込み性能の質的評価を提案する。
- 参考スコア(独自算出の注目度): 3.2925222641796554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The DEDICOM algorithm provides a uniquely interpretable matrix factorization method for symmetric and asymmetric square matrices. We employ a new row-stochastic variation of DEDICOM on the pointwise mutual information matrices of text corpora to identify latent topic clusters within the vocabulary and simultaneously learn interpretable word embeddings. We introduce a method to efficiently train a constrained DEDICOM algorithm and a qualitative evaluation of its topic modeling and word embedding performance.
- Abstract(参考訳): DEDICOMアルゴリズムは対称および非対称二乗行列に対して一意に解釈可能な行列分解法を提供する。
我々は、テキストコーパスのポイントワイドな相互情報行列にDEDICOMの新しい行確率的変化を適用し、語彙内の潜在トピッククラスタを特定し、同時に解釈可能な単語埋め込みを学習する。
本稿では,制約付きDEDICOMアルゴリズムを効率的に学習する手法と,そのトピックモデリングと単語埋め込み性能の質的評価を提案する。
関連論文リスト
- Synergistic eigenanalysis of covariance and Hessian matrices for enhanced binary classification [72.77513633290056]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
本手法は複雑なパターンと関係を抽出し,分類性能を向上する。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - Deep Unrolling for Nonconvex Robust Principal Component Analysis [75.32013242448151]
我々はロバスト成分分析のためのアルゴリズムを設計する(A)
行列を低主行列とスパース主行列の和に分解する。
論文 参考訳(メタデータ) (2023-07-12T03:48:26Z) - Transductive Matrix Completion with Calibration for Multi-Task Learning [3.7660066212240757]
マルチタスク学習フレームワークにおける特徴量に対する校正制約を組み込んだトランスダクティブ行列補完アルゴリズムを提案する。
提案アルゴリズムは,不完全特徴行列とターゲット行列を同時に復元する。
いくつかの合成データ実験を行い、提案手法が既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-02-20T08:47:23Z) - Exploring ordered patterns in the adjacency matrix for improving machine
learning on complex networks [0.0]
提案手法は、複素グラフの隣接行列の要素を特定の順序で並べ替えるソートアルゴリズムを用いる。
結果のソートされた隣接行列は、特徴抽出と機械学習アルゴリズムの入力として使用され、ネットワークを分類する。
論文 参考訳(メタデータ) (2023-01-20T00:01:23Z) - Generalised Spherical Text Embedding [24.217143085109946]
単語と段落を任意の列次元の個々の行列として単位フロベニウスノルムと共同で符号化する。
我々は、同じ行列を単位ノルムのベクトルに変形し、球面多様体上の最適化問題に変換することを示した。
また、文書分類、文書クラスタリング、意味的類似性ベンチマークテストの改善結果を示すことによって、テキスト埋め込みの品質を定量的に検証する。
論文 参考訳(メタデータ) (2022-11-30T07:50:07Z) - Object Representations as Fixed Points: Training Iterative Refinement
Algorithms with Implicit Differentiation [88.14365009076907]
反復的洗練は表現学習に有用なパラダイムである。
トレーニングの安定性とトラクタビリティを向上させる暗黙の差別化アプローチを開発する。
論文 参考訳(メタデータ) (2022-07-02T10:00:35Z) - Comparative Study of Inference Methods for Interpolative Decomposition [4.913248451323163]
補間分解(ID)学習のための自動関係決定(ARD)を用いた確率モデルを提案する。
CCLE $EC50$, CCLE $IC50$, Gene Body Methylation, promoteder Methylation datasets with different size, and dimensions。
論文 参考訳(メタデータ) (2022-06-29T11:37:05Z) - High-Dimensional Sparse Bayesian Learning without Covariance Matrices [66.60078365202867]
共分散行列の明示的な構成を避ける新しい推論手法を提案する。
本手法では, 数値線形代数と共役勾配アルゴリズムの対角線推定結果とを結合する。
いくつかのシミュレーションにおいて,本手法は計算時間とメモリにおける既存手法よりも拡張性が高い。
論文 参考訳(メタデータ) (2022-02-25T16:35:26Z) - Learning Log-Determinant Divergences for Positive Definite Matrices [47.61701711840848]
本稿では,データ駆動方式で類似度を学習することを提案する。
スカラーアルファとベータによってパラメトリ化されたメタダイバージェンスであるalphabeta-log-detの発散を利用する。
私たちの重要なアイデアは、これらのパラメータを連続体にキャストし、データから学ぶことです。
論文 参考訳(メタデータ) (2021-04-13T19:09:43Z) - Adversarially-Trained Nonnegative Matrix Factorization [77.34726150561087]
非負行列ファクタリゼーションの逆学習版を検討する。
我々の定式化では、攻撃者は与えられたデータ行列に有界ノルムの任意の行列を追加する。
辞書と係数行列を最適化するために, 逆学習に触発された効率的なアルゴリズムを設計する。
論文 参考訳(メタデータ) (2021-04-10T13:13:17Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。