論文の概要: Tethering Broken Themes: Aligning Neural Topic Models with Labels and Authors
- arxiv url: http://arxiv.org/abs/2410.18140v1
- Date: Tue, 22 Oct 2024 11:20:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 12:50:45.339535
- Title: Tethering Broken Themes: Aligning Neural Topic Models with Labels and Authors
- Title(参考訳): Tethering Broken Themes: ラベルと著者によるニューラルトピックモデルのアライメント
- Authors: Mayank Nagda, Phil Ostheimer, Sophie Fellenz,
- Abstract要約: ラベルと著者情報の両方でニューラルトピックモデルを整列するFANToMを紹介する。
提案手法は,ラベル,トピック,著者間のアライメントを学習することで,従来のトピックモデルよりも表現力が高いことを示す。
- 参考スコア(独自算出の注目度): 2.048226951354646
- License:
- Abstract: Topic models are a popular approach for extracting semantic information from large document collections. However, recent studies suggest that the topics generated by these models often do not align well with human intentions. While metadata such as labels and authorship information is available, it has not yet been effectively incorporated into neural topic models. To address this gap, we introduce FANToM, a novel method for aligning neural topic models with both labels and authorship information. FANToM allows for the inclusion of this metadata when available, producing interpretable topics and author distributions for each topic. Our approach demonstrates greater expressiveness than conventional topic models by learning the alignment between labels, topics, and authors. Experimental results show that FANToM improves upon existing models in terms of both topic quality and alignment. Additionally, it identifies author interests and similarities.
- Abstract(参考訳): トピックモデルは、大きなドキュメントコレクションから意味情報を抽出する一般的なアプローチである。
しかし、近年の研究では、これらのモデルが生み出すトピックは人間の意図とうまく一致しないことが多いことが示唆されている。
ラベルやオーサシップ情報などのメタデータは利用可能だが、まだニューラルネットワークモデルに効果的に組み込まれていない。
このギャップに対処するために、ラベルと著者情報の両方にニューラルトピックモデルを整合させる新しい方法であるFANToMを紹介する。
FANToMはこのメタデータを利用可能にすることで、各トピックの解釈可能なトピックと作者のディストリビューションを生成することができる。
提案手法は,ラベル,トピック,著者間のアライメントを学習することで,従来のトピックモデルよりも表現力が高いことを示す。
実験結果から,FANToMはトピックの品質とアライメントの両面で既存のモデルを改善することが示された。
また、作者の興味や類似点も挙げている。
関連論文リスト
- Embedded Topic Models Enhanced by Wikification [3.082729239227955]
ウィキペディアの知識をニューラルトピックモデルに組み込んで、名前付きエンティティを認識する。
実験により,本手法は一般化可能性において,ニューラルトピックモデルの性能を向上させることが示された。
論文 参考訳(メタデータ) (2024-10-03T12:39:14Z) - Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - GINopic: Topic Modeling with Graph Isomorphism Network [0.8962460460173959]
本稿では,グラフ同型ネットワークに基づく話題モデリングフレームワークGINopicを紹介し,単語間の相関関係を捉える。
本稿では,既存のトピックモデルと比較してGINopicの有効性を実証し,トピックモデリングの進歩の可能性を明らかにする。
論文 参考訳(メタデータ) (2024-04-02T17:18:48Z) - Labeled Interactive Topic Models [10.555664965166232]
本稿では,ニューラルトピックモデルに対するユーザフレンドリなインタラクションを提案する。
このインタラクションにより、ユーザはトピックにワードラベルを割り当てることが可能になる。
提案手法は人間による研究によって評価され,ユーザが関連する文書を検索するためにトピックを緩和することができる。
論文 参考訳(メタデータ) (2023-11-15T23:18:01Z) - Federated Neural Topic Models [0.0]
フェデレートされたトピックモデリングにより、複数のパーティがデータを共有することなく、共同でトピックモデルをトレーニングできる。
我々は、最先端のニューラルトピックモデリング実装に基づいて、フェデレートされた実装を提案し、分析する。
実際には、我々のアプローチは集中型モデルトレーニングに相当しますが、ノードのプライバシを保持します。
論文 参考訳(メタデータ) (2022-12-05T13:49:26Z) - Are Neural Topic Models Broken? [81.15470302729638]
トピックモデルの自動評価と人的評価の関係について検討する。
ニューラルトピックモデルは、確立された古典的手法と比較して、両方の点においてより悪くなる。
論文 参考訳(メタデータ) (2022-10-28T14:38:50Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - A Disentangled Adversarial Neural Topic Model for Separating Opinions
from Plots in User Reviews [35.802290746473524]
本稿では,ニューラルトピックモデルと敵対的トレーニングを組み合わせることで,プロットと中立的トピックから意見トピックを分離する手法を提案する。
本研究は,新たな映画・書評の収集とプロットの併用による評価を実験的に実施する。
改善されたコヒーレンスと多種多様なトピック、一貫した絡み合い率、および他の教師付きトピックモデルよりも優れた感情分類性能を示す。
論文 参考訳(メタデータ) (2020-10-22T02:15:13Z) - Improving Neural Topic Models using Knowledge Distillation [84.66983329587073]
我々は,確率論的トピックモデルと事前学習されたトランスフォーマーの最適属性を組み合わせるために,知識蒸留を用いる。
我々のモジュラー手法は、どのニューラルトピックモデルでも簡単に適用でき、トピックの品質を向上させることができる。
論文 参考訳(メタデータ) (2020-10-05T22:49:16Z) - Topic Adaptation and Prototype Encoding for Few-Shot Visual Storytelling [81.33107307509718]
トピック間一般化の能力をモデル化するためのトピック適応型ストーリーテラを提案する。
また,アトピー内導出能力のモデル化を目的とした符号化手法の試作も提案する。
実験結果から,トピック適応とプロトタイプ符号化構造が相互に利益をもたらすことが明らかとなった。
論文 参考訳(メタデータ) (2020-08-11T03:55:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。