論文の概要: An Embedding-based Joint Sentiment-Topic Model for Short Texts
- arxiv url: http://arxiv.org/abs/2103.14410v1
- Date: Fri, 26 Mar 2021 11:41:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 18:54:28.699810
- Title: An Embedding-based Joint Sentiment-Topic Model for Short Texts
- Title(参考訳): 埋め込みによる短いテキストに対する関節感覚トピックモデル
- Authors: Ayan Sengupta, William Scott Paka, Suman Roy, Gaurav Ranjan, Tanmoy
Chakraborty
- Abstract要約: 我々は,embedd enhanced generative joint sentiment-topic モデルである eljst を開発した。
短いテキストからよりコヒーレントで多様なトピックを見つけることができる。
その結果,トピックコヒーレンスの平均は10%,トピックの多様化は5%改善した。
- 参考スコア(独自算出の注目度): 15.241185591218265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Short text is a popular avenue of sharing feedback, opinions and reviews on
social media, e-commerce platforms, etc. Many companies need to extract
meaningful information (which may include thematic content as well as semantic
polarity) out of such short texts to understand users' behaviour. However,
obtaining high quality sentiment-associated and human interpretable themes
still remains a challenge for short texts. In this paper we develop ELJST, an
embedding enhanced generative joint sentiment-topic model that can discover
more coherent and diverse topics from short texts. It uses Markov Random Field
Regularizer that can be seen as a generalisation of skip-gram based models.
Further, it can leverage higher-order semantic information appearing in word
embedding, such as self-attention weights in graphical models. Our results show
an average improvement of 10% in topic coherence and 5% in topic
diversification over baselines. Finally, ELJST helps understand users'
behaviour at more granular levels which can be explained. All these can bring
significant values to the service and healthcare industries often dealing with
customers.
- Abstract(参考訳): ショートテキストは、ソーシャルメディアやeコマースプラットフォームなどで、フィードバックや意見、レビューを共有する一般的な方法だ。
多くの企業は、ユーザの振る舞いを理解するために、このような短いテキストから意味のある情報(テーマの内容とセマンティックな極性を含むこともある)を抽出する必要がある。
しかし、質の高い感情関連や人間の解釈可能なテーマを得ることは、短文の難題であり続けている。
本稿では,短いテキストからよりコヒーレントで多様なトピックを発見可能な,統合的統合感情トピックモデルであるELJSTを開発する。
これはMarkov Random Field Regularizerを使用し、スキップグラムベースのモデルの一般化と見なすことができる。
さらに、グラフィカルモデルにおける自己注意重みなどの単語埋め込みに現れる高次意味情報を活用できる。
その結果,トピック・コヒーレンスでは平均10%,トピック・コヒーレンスでは5%の改善が見られた。
最後に、ELJSTは、より詳細なレベルでユーザーの振る舞いを理解するのに役立つ。
これらすべてが、顧客を扱うサービスや医療産業に大きな価値をもたらします。
関連論文リスト
- Hierarchical Knowledge Distillation on Text Graph for Data-limited
Attribute Inference [5.618638372635474]
我々は,ソーシャルメディアのテキストデータに基づく属性推論のためのテキストグラフに基づく少ショット学習モデルを開発した。
我々のモデルはまず、多様体学習とメッセージパッシングを用いてテキストグラフを構築し、洗練する。
クロスドメインテキストと未ラベルテキストをさらに活用して、少数ショットのパフォーマンスを向上させるために、テキストグラフ上で階層的な知識蒸留が考案される。
論文 参考訳(メタデータ) (2024-01-10T05:50:34Z) - Context Unlocks Emotions: Text-based Emotion Classification Dataset
Auditing with Large Language Models [23.670143829183104]
テキストデータに文脈情報がないため、テキストベースの感情分類データセットのアノテーションプロセスは困難である。
本稿では,このような文脈情報を強化するための促進戦略を動機付けるために,テキストコンテキストの形式的定義を提案する。
提案手法は, 経験的, 人的評価的両面から, 入力と人的アノテートラベルのアライメントを改善する。
論文 参考訳(メタデータ) (2023-11-06T21:34:49Z) - TopicGPT: A Prompt-based Topic Modeling Framework [77.72072691307811]
TopicGPTは,大規模言語モデルを用いてテキストコレクション内の潜在トピックを明らかにするプロンプトベースのフレームワークである。
競合する手法と比較して、人間の分類とよく一致したトピックを生成する。
そのトピックもまた解釈可能であり、自然言語ラベルと関連する自由形式の記述を含むトピックを好んで、曖昧な言葉の袋を除いた。
論文 参考訳(メタデータ) (2023-11-02T17:57:10Z) - Enriching language models with graph-based context information to better
understand textual data [0.15469452301122172]
BERTモデルへのグラフベースの文脈化が,分類タスクの例において,その性能を向上させることを実験的に実証した。
具体的には、Pubmedデータセット上で、エラーを8.51%から7.96%に削減し、パラメータの数を1.6%増加させた。
論文 参考訳(メタデータ) (2023-05-10T10:57:21Z) - Summarization with Graphical Elements [55.5913491389047]
本稿では,グラフィカル要素による要約という新しい課題を提案する。
タスクの研究を支援するために,高品質なラベル付きデータセットを収集する。
論文 参考訳(メタデータ) (2022-04-15T17:16:41Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Hierarchical Text Interaction for Rating Prediction [8.400688907233398]
評価予測のための階層型テキストインタラクションモデルを提案する。
階層の異なる各ユーザ-イテムペア間のセマンティックな相関を利用する。
5つの実世界のデータセットの実験により、HTIは最先端のモデルよりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2020-10-15T09:52:40Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z) - Topic Modeling on User Stories using Word Mover's Distance [4.378337862197529]
本稿では,クラウド生成ユーザストーリーの集合内のトピックを識別する手段として,トピックモデリングに焦点を当てる。
群衆労働者による2,966件のユーザストーリーを公開して評価した。
論文 参考訳(メタデータ) (2020-07-10T11:05:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。