論文の概要: What is Sentiment Meant to Mean to Language Models?
- arxiv url: http://arxiv.org/abs/2405.02454v1
- Date: Fri, 3 May 2024 19:37:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-07 19:50:15.831238
- Title: What is Sentiment Meant to Mean to Language Models?
- Title(参考訳): 言語モデルにおける感性の意味は何か?
- Authors: Michael Burnham,
- Abstract要約: センチメント(sentiment)は、使用するドメインやツールによって、さまざまな概念を包含する。
感覚」は、感情、意見、市場の動き、あるいは単に一般の善悪の次元を意味するために使われてきた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sentiment analysis is one of the most widely used techniques in text analysis. Recent advancements with Large Language Models have made it more accurate and accessible than ever, allowing researchers to classify text with only a plain English prompt. However, "sentiment" entails a wide variety of concepts depending on the domain and tools used. It has been used to mean emotion, opinions, market movements, or simply a general ``good-bad'' dimension. This raises a question: What exactly are language models doing when prompted to label documents by sentiment? This paper first overviews how sentiment is defined across different contexts, highlighting that it is a confounded measurement construct in that it entails multiple variables, such as emotional valence and opinion, without disentangling them. I then test three language models across two data sets with prompts requesting sentiment, valence, and stance classification. I find that sentiment labels most strongly correlate with valence labels. I further find that classification improves when researchers more precisely specify their dimension of interest rather than using the less well-defined concept of sentiment. I conclude by encouraging researchers to move beyond "sentiment" when feasible and use a more precise measurement construct.
- Abstract(参考訳): 感性分析はテキスト分析において最も広く使われている手法の1つである。
近年のLarge Language Modelsの進歩により、これまで以上に正確でアクセスしやすくなり、研究者は普通の英語のプロンプトでテキストを分類できるようになった。
しかし「感覚」には、使用するドメインやツールによって様々な概念が伴う。
感情、意見、市場の動き、あるいは単に「良いバッド」の次元を表すために使われてきた。
感情によってドキュメントをラベル付けするよう促されたとき、言語モデルは正確に何をしているのか?
本稿では、まず、感情がさまざまな文脈でどのように定義されているかを概説し、感情的価値や意見などの複数の変数を無関係に包含する計測構造であることを示す。
次に、2つのデータセットにまたがって3つの言語モデルをテストする。
感情ラベルは、価値ラベルと最も強く相関していると思います。
さらに、よく定義されていない感情の概念を使うよりも、研究者がより正確に関心の次元を特定することで、分類が改善されることがわかりました。
私は、研究者に、実現可能な時に「感覚」を超えて、より正確な測定構造を使うよう促すことで締めくくります。
関連論文リスト
- Entity-Level Sentiment: More than the Sum of Its Parts [13.829487868948682]
文レベルでの感情の算術的アグリゲーションとは,エンティティに対する読者の知覚的感情がしばしば異なることを示す。
我々のデータセットは、長いテキストでエンティティ固有の感情の複雑さを明らかにします。
論文 参考訳(メタデータ) (2024-07-04T13:21:07Z) - English Prompts are Better for NLI-based Zero-Shot Emotion
Classification than Target-Language Prompts [17.099269597133265]
たとえデータが異なる言語であっても、英語のプロンプトを使う方が一貫して良いことを示す。
自然言語推論に基づく言語モデルを用いた実験は、データが異なる言語である場合でも、英語のプロンプトを使う方が一貫して良いことを示す。
論文 参考訳(メタデータ) (2024-02-05T17:36:19Z) - Linguistic features for sentence difficulty prediction in ABSA [0.3172761915061083]
ドメインの多様性と構文の多様性が難易度に与える影響について検討する。
私たちは文の難易度を定義する2つの方法を採用している。
また、文レベルでの難易度を推定することを目的とした9つの言語的特徴も定義する。
論文 参考訳(メタデータ) (2024-02-05T16:31:03Z) - A Soft Contrastive Learning-based Prompt Model for Few-shot Sentiment
Analysis [38.17825180485807]
数ショットの感情分析のためのソフトコントラスト学習に基づくPromptモデルを提案する。
まず、感情を予測するためにモデルを導くために、感情を意識した思考プロンプトモジュールを設計する。
そこで本研究では,ラベルの相関を考慮したソフトコントラスト学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-16T15:17:28Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Sentiment-Aware Word and Sentence Level Pre-training for Sentiment
Analysis [64.70116276295609]
SentiWSPは、WordレベルとSentenceレベルの事前トレーニングタスクを組み合わせた、Sentiment対応の事前トレーニング言語モデルである。
SentiWSPは、様々な文レベルおよびアスペクトレベルの感情分類ベンチマーク上で、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T12:25:29Z) - KESA: A Knowledge Enhanced Approach For Sentiment Analysis [13.937274761540925]
文レベルの感情分析について検討し、感情語クローゼと条件付き感情予測という2つの感情認識補助課題を提案する。
実験結果から,本手法はトレーニング済みモデルよりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2022-02-24T13:21:27Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - A computational model implementing subjectivity with the 'Room Theory'.
The case of detecting Emotion from Text [68.8204255655161]
本研究は,テキスト分析における主観性と一般的文脈依存性を考慮した新しい手法を提案する。
単語間の類似度を用いて、ベンチマーク中の要素の相対的関連性を抽出することができる。
この方法は、主観的評価がテキストの相対値や意味を理解するために関係しているすべてのケースに適用できる。
論文 参考訳(メタデータ) (2020-05-12T21:26:04Z) - A Deep Neural Framework for Contextual Affect Detection [51.378225388679425]
感情を持たない短い単純なテキストは、その文脈と共に読むときに強い感情を表現することができる。
文中の単語の相互依存を学習する文脈影響検出フレームワークを提案する。
論文 参考訳(メタデータ) (2020-01-28T05:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。