論文の概要: A Multiscale Geometric Method for Capturing Relational Topic Alignment
- arxiv url: http://arxiv.org/abs/2511.21741v1
- Date: Fri, 21 Nov 2025 22:45:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.195213
- Title: A Multiscale Geometric Method for Capturing Relational Topic Alignment
- Title(参考訳): リレーショナルトピックアライメントのマルチスケール幾何法
- Authors: Conrad D. Hougen, Karl T. Pazdernik, Alfred O. Hero,
- Abstract要約: 解釈可能なトピックモデリングは、共同著者コミュニティ内で研究の利益がどのように進化するかを追跡するのに不可欠である。
本稿では,階層的なトピックデンドログラムを構築するために,Hellinger 距離と Ward リンクを用いたマルチモーダルテキストと共著者ネットワークデータを統合する手法を提案する。
本手法は, レアトピック構造を効果的に同定し, 時間とともにスムーズなトピックドリフトを可視化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interpretable topic modeling is essential for tracking how research interests evolve within co-author communities. In scientific corpora, where novelty is prized, identifying underrepresented niche topics is particularly important. However, contemporary models built from dense transformer embeddings tend to miss rare topics and therefore also fail to capture smooth temporal alignment. We propose a geometric method that integrates multimodal text and co-author network data, using Hellinger distances and Ward's linkage to construct a hierarchical topic dendrogram. This approach captures both local and global structure, supporting multiscale learning across semantic and temporal dimensions. Our method effectively identifies rare-topic structure and visualizes smooth topic drift over time. Experiments highlight the strength of interpretable bag-of-words models when paired with principled geometric alignment.
- Abstract(参考訳): 解釈可能なトピックモデリングは、共同著者コミュニティ内で研究の利益がどのように進化するかを追跡するのに不可欠である。
ノベルティが評価される科学コーパスでは、あまり表現されていないニッチなトピックを特定することが特に重要である。
しかし、密度の強い変圧器の埋め込みから構築された現代モデルは稀なトピックを見逃しがちであり、したがってスムーズな時間的アライメントを捉えることができない。
本稿では,階層的なトピックデンドログラムを構築するために,Hellinger 距離と Ward リンクを用いて,マルチモーダルテキストと共著者ネットワークデータを統合する幾何学的手法を提案する。
このアプローチは局所的およびグローバルな構造の両方を捉え、意味的および時間的次元にわたるマルチスケール学習をサポートする。
本手法は, レアトピック構造を効果的に同定し, 時間とともにスムーズなトピックドリフトを可視化する。
実験は、原理化された幾何学的アライメントと組み合わせた場合、解釈可能な単語のバッグ・オブ・ワードモデルの強さを強調している。
関連論文リスト
- GeoGNN: Quantifying and Mitigating Semantic Drift in Text-Attributed Graphs [59.61242815508687]
テキスト分散グラフ(TAG)上のグラフニューラルネットワーク(GNN)は、事前訓練された言語モデル(PLM)を使用してノードテキストを符号化し、これらの埋め込みを線形近傍アグリゲーションを通じて伝播する。
本研究は,意味的ドリフトの度合いを計測する局所PCAベースの計量を導入し,異なる凝集機構が多様体構造にどのように影響するかを解析するための最初の定量的枠組みを提供する。
論文 参考訳(メタデータ) (2025-11-12T06:48:43Z) - Dynamic Topic Evolution with Temporal Decay and Attention in Large Language Models [3.4219049032524804]
本稿では,時間的大言語モデルに基づく動的トピック進化のためのモデリングフレームワークを提案する。
提案手法は,大規模テキストにおける動的セマンティックパターンを理解するための体系的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-10-12T13:50:41Z) - Visualizing Temporal Topic Embeddings with a Compass [1.5184974790808403]
本稿では,コンパス整列時相Word2Vec手法を動的トピックモデリングに拡張することを提案する。
このような手法により、動的トピックにおける時間にわたって単語と文書の埋め込みを直接比較することができる。
論文 参考訳(メタデータ) (2024-09-16T18:29:19Z) - How Do Transformers Learn Topic Structure: Towards a Mechanistic
Understanding [56.222097640468306]
我々は、トランスフォーマーが「意味構造」を学ぶ方法の機械的理解を提供する
数学的解析とウィキペディアデータの実験を組み合わせることで、埋め込み層と自己保持層がトピック構造をエンコードしていることを示す。
論文 参考訳(メタデータ) (2023-03-07T21:42:17Z) - ANTM: An Aligned Neural Topic Model for Exploring Evolving Topics [1.854328133293073]
本稿では、アラインドニューラルトピックモデル(ANTM)と呼ばれる動的トピックモデルのアルゴリズム系を提案する。
ANTMは、新しいデータマイニングアルゴリズムを組み合わせて、進化するトピックを発見するためのモジュラーフレームワークを提供する。
Pythonパッケージは、大規模テキストデータにおけるトピックのトレンドと進化パターンを研究したい研究者や科学者のために開発されている。
論文 参考訳(メタデータ) (2023-02-03T02:31:12Z) - Variational Cross-Graph Reasoning and Adaptive Structured Semantics
Learning for Compositional Temporal Grounding [143.5927158318524]
テンポラルグラウンドティング(Temporal grounding)とは、クエリ文に従って、未編集のビデオから特定のセグメントを特定するタスクである。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
ビデオや言語に内在する構造的意味論は、構成的一般化を実現する上で重要な要素である、と我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T08:02:23Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - Topic Scaling: A Joint Document Scaling -- Topic Model Approach To Learn
Time-Specific Topics [0.0]
本稿では,文書位置の尺度から時間に基づくトピックを学習する2段階アルゴリズムを実装し,シーケンシャルコーパスを研究する新しい手法を提案する。
最初の段階はWordfishを使用してドキュメントをランク付けし、関連するトピックを学ぶために依存変数として機能する文書の位置を推定します。
第二段階は、コーパス内のそれらの発生と一致するように文書スケール上の推論されたトピックをランク付けし、それらの進化を追跡します。
論文 参考訳(メタデータ) (2021-03-31T12:35:36Z) - Quadric hypersurface intersection for manifold learning in feature space [52.83976795260532]
適度な高次元と大きなデータセットに適した多様体学習技術。
この手法は、二次超曲面の交点という形で訓練データから学習される。
テスト時、この多様体は任意の新しい点に対する外れ値スコアを導入するのに使うことができる。
論文 参考訳(メタデータ) (2021-02-11T18:52:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。