論文の概要: Query-Driven Topic Model
- arxiv url: http://arxiv.org/abs/2106.07346v1
- Date: Fri, 28 May 2021 22:49:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-20 21:57:11.806432
- Title: Query-Driven Topic Model
- Title(参考訳): クエリ駆動トピックモデル
- Authors: Zheng Fang, Yulan He and Rob Procter
- Abstract要約: トピックモデルの望ましい特性の1つは、ユーザーがコーパスの特定の側面を記述するトピックを見つけることを可能にすることである。
本稿では,単語やフレーズで簡単なクエリを指定し,クエリ関連トピックを返却する,新しいクエリ駆動トピックモデルを提案する。
- 参考スコア(独自算出の注目度): 23.07260625816975
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Topic modeling is an unsupervised method for revealing the hidden semantic
structure of a corpus. It has been increasingly widely adopted as a tool in the
social sciences, including political science, digital humanities and
sociological research in general. One desirable property of topic models is to
allow users to find topics describing a specific aspect of the corpus. A
possible solution is to incorporate domain-specific knowledge into topic
modeling, but this requires a specification from domain experts. We propose a
novel query-driven topic model that allows users to specify a simple query in
words or phrases and return query-related topics, thus avoiding tedious work
from domain experts. Our proposed approach is particularly attractive when the
user-specified query has a low occurrence in a text corpus, making it difficult
for traditional topic models built on word cooccurrence patterns to identify
relevant topics. Experimental results demonstrate the effectiveness of our
model in comparison with both classical topic models and neural topic models.
- Abstract(参考訳): トピックモデリングはコーパスの隠された意味構造を明らかにする教師なしの手法である。
社会科学の道具として広く採用され、政治科学、デジタル人文科学、社会学全般の研究が盛んに行われている。
トピックモデルの望ましい特性の1つは、ユーザがコーパスの特定の側面を記述するトピックを見つけることを可能にすることである。
可能な解決策は、トピックモデリングにドメイン固有の知識を組み込むことだが、これはドメインエキスパートの仕様を必要とする。
本稿では,キーワードやフレーズで簡単なクエリを指定し,クエリ関連トピックを返却できる新しいクエリ駆動トピックモデルを提案する。
提案手法は,テキストコーパスにおいてユーザ指定クエリが低い場合に特に魅力的であり,単語共起パターンに基づく従来のトピックモデルでは関連トピックの特定が困難である。
実験の結果,従来のトピックモデルとニューラルトピックモデルとの比較により,モデルの有効性が示された。
関連論文リスト
- Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - TopicAdapt- An Inter-Corpora Topics Adaptation Approach [27.450275637652418]
本稿では、関連するソースコーパスから関連するトピックを適応し、ソースコーパスに存在しないターゲットコーパスに新しいトピックを発見できるトピックモデルTopicAdaptを提案する。
多様なドメインからの複数のデータセットに対する実験は、最先端のトピックモデルに対して提案されたモデルの優位性を示している。
論文 参考訳(メタデータ) (2023-10-08T02:56:44Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Federated Neural Topic Models [0.0]
フェデレートされたトピックモデリングにより、複数のパーティがデータを共有することなく、共同でトピックモデルをトレーニングできる。
我々は、最先端のニューラルトピックモデリング実装に基づいて、フェデレートされた実装を提案し、分析する。
実際には、我々のアプローチは集中型モデルトレーニングに相当しますが、ノードのプライバシを保持します。
論文 参考訳(メタデータ) (2022-12-05T13:49:26Z) - Coordinated Topic Modeling [10.710176350043998]
本稿では,テキストコーパスを記述しながら人間の行動を模倣する「協調話題モデリング」という新しい問題を提案する。
我々は,対象のコーパス固有の側面を捕捉するために,参照表現を効果的に利用する埋め込み型協調トピックモデルECTMを設計する。
ECTMでは,課題を解決するための自己学習機構を備えたトピックレベルと文書レベルの監視を導入する。
論文 参考訳(メタデータ) (2022-10-16T15:10:54Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Improving Neural Topic Models using Knowledge Distillation [84.66983329587073]
我々は,確率論的トピックモデルと事前学習されたトランスフォーマーの最適属性を組み合わせるために,知識蒸留を用いる。
我々のモジュラー手法は、どのニューラルトピックモデルでも簡単に適用でき、トピックの品質を向上させることができる。
論文 参考訳(メタデータ) (2020-10-05T22:49:16Z) - Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。
トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文 参考訳(メタデータ) (2020-09-26T08:43:06Z) - Keyword Assisted Topic Models [0.0]
少数のキーワードを提供することで,話題モデルの計測性能を大幅に向上させることができることを示す。
KeyATMは、より解釈可能な結果を提供し、文書分類性能が向上し、標準トピックモデルよりもトピックの数に敏感でない。
論文 参考訳(メタデータ) (2020-04-13T14:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。