論文の概要: Lex2Sent: A bagging approach to unsupervised sentiment analysis
- arxiv url: http://arxiv.org/abs/2209.13023v1
- Date: Mon, 26 Sep 2022 20:49:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 15:15:15.254698
- Title: Lex2Sent: A bagging approach to unsupervised sentiment analysis
- Title(参考訳): Lex2Sent: 教師なし感情分析のためのバッグングアプローチ
- Authors: Kai-Robin Lange, Jonas Rieger, Carsten Jentsch
- Abstract要約: 本論文で提案するLex2Sentは,感情辞書手法の分類を改善するための教師なし感情分析手法である。
本論文では,3つのベンチマークデータセットに対して,提案したLex2Sentは評価されたレキシコンのすべてに優れる。
- 参考スコア(独自算出の注目度): 0.42970700836450487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised sentiment analysis is traditionally performed by counting those
words in a text that are stored in a sentiment lexicon and then assigning a
label depending on the proportion of positive and negative words registered.
While these "counting" methods are considered to be beneficial as they rate a
text deterministically, their classification rates decrease when the analyzed
texts are short or the vocabulary differs from what the lexicon considers
default. The model proposed in this paper, called Lex2Sent, is an unsupervised
sentiment analysis method to improve the classification of sentiment lexicon
methods. For this purpose, a Doc2Vec-model is trained to determine the
distances between document embeddings and the embeddings of the positive and
negative part of a sentiment lexicon. These distances are then evaluated for
multiple executions of Doc2Vec on resampled documents and are averaged to
perform the classification task. For three benchmark datasets considered in
this paper, the proposed Lex2Sent outperforms every evaluated lexicon,
including state-of-the-art lexica like VADER or the Opinion Lexicon in terms of
classification rate.
- Abstract(参考訳): 教師なし感情分析は、伝統的に感情辞書に格納されたテキストにこれらの単語をカウントし、正と負の単語の割合に応じてラベルを割り当てる。
これらの「計数」法はテキストを決定論的に評価することで有益と考えられるが、解析されたテキストが短い場合や語彙が既定であると考えるものと異なる場合、分類率は低下する。
本論文で提案するモデルはlex2sentと呼ばれ,感情語彙法の分類を改善するための教師なし感情分析手法である。
この目的のためにDoc2Vecモデルを訓練し、文書埋め込みと感情辞書の正および負の部分の埋め込みの距離を決定する。
これらの距離は、再サンプリングされた文書上でDoc2Vecの複数の実行に対して評価され、分類タスクを実行するために平均化される。
本論文で検討した3つのベンチマークデータセットにおいて,提案するlex2sentは,vader のような最先端のlexica やオピニオン・レキシコンといった評価されたレキシコンを,分類率で上回っている。
関連論文リスト
- A Comparison of Lexicon-Based and ML-Based Sentiment Analysis: Are There
Outlier Words? [14.816706893177997]
本稿では、4つのドメインから抽出された15万以上の英語テキストに対する感情を計算する。
回帰モデルを用いて各ドメインの文書に対するアプローチ間の感情スコアの差をモデル化する。
以上の結果から,単語の重要性はドメインに依存しており,感情スコアの違いを系統的に引き起こす辞書項目が存在しないことが示唆された。
論文 参考訳(メタデータ) (2023-11-10T18:21:50Z) - Sentiment-Aware Word and Sentence Level Pre-training for Sentiment
Analysis [64.70116276295609]
SentiWSPは、WordレベルとSentenceレベルの事前トレーニングタスクを組み合わせた、Sentiment対応の事前トレーニング言語モデルである。
SentiWSPは、様々な文レベルおよびアスペクトレベルの感情分類ベンチマーク上で、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T12:25:29Z) - LEXpander: applying colexification networks to automated lexicon
expansion [0.16804697591495946]
LEXpander は,新しいコネクティフィケーションデータを活用する辞書拡張手法である。
LEXpanderは,単語リストの精度とリコールのトレードオフの両面から,既存の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-05-31T14:55:29Z) - Out-of-Category Document Identification Using Target-Category Names as
Weak Supervision [64.671654559798]
Out-of-category Detection は、文書が不適格(またはターゲット)カテゴリと意味的関連性に応じて区別することを目的としている。
対象のカテゴリの1つに属する文書の信頼性を効果的に測定する,カテゴリ外検出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-24T21:01:25Z) - Fine-Grained Opinion Summarization with Minimal Supervision [48.43506393052212]
FineSumは、複数のドキュメントから意見を抽出することでターゲットをプロファイルすることを目的としている。
FineSumは、生のコーパスから意見語句を自動的に識別し、異なる側面と感情に分類し、各アスペクト/感覚の下に複数のきめ細かい意見クラスタを構築する。
ベンチマークの自動評価と定量的人的評価の両方が,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2021-10-17T15:16:34Z) - LexSubCon: Integrating Knowledge from Lexical Resources into Contextual
Embeddings for Lexical Substitution [76.615287796753]
本稿では,コンテキスト埋め込みモデルに基づくエンドツーエンドの語彙置換フレームワークであるLexSubConを紹介する。
これは文脈情報と構造化語彙資源からの知識を組み合わせることで達成される。
我々の実験によると、LexSubConはLS07とCoInCoベンチマークデータセットで従来の最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-11T21:25:56Z) - Improving Document-Level Sentiment Classification Using Importance of
Sentences [3.007949058551534]
深層ニューラルネットワークに基づく文書レベルの文分類モデルを提案する。
映画レビュー,ホテルレビュー,レストランレビュー,音楽レビューなど,4つの異なる領域における感情データセットを用いた実験を行った。
実験の結果,文書レベルの感情分類タスクでは文の重要性を考慮すべきであることがわかった。
論文 参考訳(メタデータ) (2021-03-09T01:29:08Z) - Enhanced word embeddings using multi-semantic representation through
lexical chains [1.8199326045904998]
フレキシブル・レキシカル・チェーンIIと固定レキシカル・チェーンIIという2つの新しいアルゴリズムを提案する。
これらのアルゴリズムは、語彙連鎖から派生した意味関係、語彙データベースからの以前の知識、および単一のシステムを形成するビルディングブロックとしての単語埋め込みにおける分布仮説の堅牢性を組み合わせている。
その結果、語彙チェーンと単語埋め込み表現の統合は、より複雑なシステムに対しても、最先端の結果を維持します。
論文 参考訳(メタデータ) (2021-01-22T09:43:33Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - A Variational Approach to Unsupervised Sentiment Analysis [8.87759101018566]
本研究では,教師なし感情分析のための変分アプローチを提案する。
我々は、監視信号としてターゲット-オピニオンワードペアを使用する。
顧客レビューと臨床物語に対する感情分析に本手法を適用した。
論文 参考訳(メタデータ) (2020-08-21T09:52:35Z) - A computational model implementing subjectivity with the 'Room Theory'.
The case of detecting Emotion from Text [68.8204255655161]
本研究は,テキスト分析における主観性と一般的文脈依存性を考慮した新しい手法を提案する。
単語間の類似度を用いて、ベンチマーク中の要素の相対的関連性を抽出することができる。
この方法は、主観的評価がテキストの相対値や意味を理解するために関係しているすべてのケースに適用できる。
論文 参考訳(メタデータ) (2020-05-12T21:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。