論文の概要: Token Sequence Labeling vs. Clause Classification for English Emotion
Stimulus Detection
- arxiv url: http://arxiv.org/abs/2010.07557v3
- Date: Mon, 9 Nov 2020 09:56:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 03:52:49.875961
- Title: Token Sequence Labeling vs. Clause Classification for English Emotion
Stimulus Detection
- Title(参考訳): 英語感情刺激検出のためのToken Sequence Labeling vs. Clause Classification
- Authors: Laura Oberl\"ander, Roman Klinger
- Abstract要約: 文節分類やシーケンスラベリングが英語の感情刺激検出に適しているかを評価する。
その結果,4つのデータセットのうち3つよりもシーケンスラベリングが優れていることがわかった。
我々の誤り分析は、節が英語の適切な刺激単位ではないことを確認した。
- 参考スコア(独自算出の注目度): 10.536415845097661
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Emotion stimulus detection is the task of finding the cause of an emotion in
a textual description, similar to target or aspect detection for sentiment
analysis. Previous work approached this in three ways, namely (1) as text
classification into an inventory of predefined possible stimuli ("Is the
stimulus category A or B?"), (2) as sequence labeling of tokens ("Which tokens
describe the stimulus?"), and (3) as clause classification ("Does this clause
contain the emotion stimulus?"). So far, setting (3) has been evaluated broadly
on Mandarin and (2) on English, but no comparison has been performed.
Therefore, we aim to answer whether clause classification or sequence labeling
is better suited for emotion stimulus detection in English. To accomplish that,
we propose an integrated framework which enables us to evaluate the two
different approaches comparably, implement models inspired by state-of-the-art
approaches in Mandarin, and test them on four English data sets from different
domains. Our results show that sequence labeling is superior on three out of
four datasets, in both clause-based and sequence-based evaluation. The only
case in which clause classification performs better is one data set with a high
density of clause annotations. Our error analysis further confirms
quantitatively and qualitatively that clauses are not the appropriate stimulus
unit in English.
- Abstract(参考訳): 感情刺激検出は、感情分析のターゲットまたはアスペクト検出と同様に、テキスト記述における感情の原因を見つけるタスクである。
以前の研究は、(1)テキスト分類から、予め定義された可能な刺激のインベントリ(刺激カテゴリーaかbか)、(2)トークンのシーケンスラベリング(刺激を表すトークンはどれか)、(3)節分類(この節は感情刺激を含むか)の3つの方法でこれをアプローチした。
今のところ、set (3) は mandarin と (2) 英語で広く評価されているが、比較はされていない。
そこで本研究では,英語の感情刺激検出に,節分類やシーケンスラベリングが適しているかどうかを問う。
そこで我々は,2つの異なるアプローチを比較検討し,マンダリンの最先端アプローチにインスパイアされたモデルを実装し,異なるドメインの4つの英語データセット上でテストする統合フレームワークを提案する。
その結果,4つのデータセットのうち3つよりもシーケンスラベルが優れていることがわかった。
節分類が優れている唯一のケースは、節アノテーションの密度の高いデータセットである。
我々の誤り分析は、節が英語の適切な刺激単位ではないことを定量的かつ質的に確認する。
関連論文リスト
- Handling Ambiguity in Emotion: From Out-of-Domain Detection to
Distribution Estimation [45.53789836426869]
感情に対する主観的な認識は、人間の注釈からの矛盾したラベルにつながる。
本稿では,あいまいな感情を扱う3つの方法について検討する。
分類器にラベルを付けない発話を付加クラスとして組み込むことで、他の感情クラスの分類性能が低下することを示す。
また,明快な深層学習を用いた感情分類における不確実性を定量化することにより,不明瞭な感情を伴う発話を領域外サンプルとして検出することを提案する。
論文 参考訳(メタデータ) (2024-02-20T09:53:38Z) - English Prompts are Better for NLI-based Zero-Shot Emotion
Classification than Target-Language Prompts [17.099269597133265]
たとえデータが異なる言語であっても、英語のプロンプトを使う方が一貫して良いことを示す。
自然言語推論に基づく言語モデルを用いた実験は、データが異なる言語である場合でも、英語のプロンプトを使う方が一貫して良いことを示す。
論文 参考訳(メタデータ) (2024-02-05T17:36:19Z) - Linguistic features for sentence difficulty prediction in ABSA [0.3172761915061083]
ドメインの多様性と構文の多様性が難易度に与える影響について検討する。
私たちは文の難易度を定義する2つの方法を採用している。
また、文レベルでの難易度を推定することを目的とした9つの言語的特徴も定義する。
論文 参考訳(メタデータ) (2024-02-05T16:31:03Z) - Paralinguistics-Enhanced Large Language Modeling of Spoken Dialogue [71.15186328127409]
パラリンGPT(Paralin GPT)
モデルは、シリアライズされたマルチタスクフレームワーク内の入力プロンプトとして、テキスト、音声埋め込み、およびパラ言語属性の会話コンテキストを取る。
音声対話データセットとして,感情ラベルをパラ言語属性として含むSwitchboard-1コーパスを利用する。
論文 参考訳(メタデータ) (2023-12-23T18:14:56Z) - RankCSE: Unsupervised Sentence Representations Learning via Learning to
Rank [54.854714257687334]
本稿では,教師なし文表現学習のための新しい手法であるRangCSEを提案する。
コントラスト学習を伴うランキング一貫性とランキング蒸留を統一された枠組みに組み込む。
セマンティックテキスト類似性(STS)と転送タスク(TR)の両方について、広範な実験が実施されている。
論文 参考訳(メタデータ) (2023-05-26T08:27:07Z) - Sentiment-Aware Word and Sentence Level Pre-training for Sentiment
Analysis [64.70116276295609]
SentiWSPは、WordレベルとSentenceレベルの事前トレーニングタスクを組み合わせた、Sentiment対応の事前トレーニング言語モデルである。
SentiWSPは、様々な文レベルおよびアスペクトレベルの感情分類ベンチマーク上で、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T12:25:29Z) - Investigating Reasons for Disagreement in Natural Language Inference [9.002603216969154]
3つのハイレベルクラスにまたがる相違点の分類法を開発した。
いくつかの相違は文の意味の不確実性によるものであり、アノテータバイアスやタスクアーティファクトによるものである。
潜在的な不一致のある項目を検出するための2つのモデリング手法について検討する。
論文 参考訳(メタデータ) (2022-09-07T18:01:39Z) - Grammar Detection for Sentiment Analysis through Improved Viterbi
Algorithm [0.0]
音声タグ付けの一部は、名詞、動詞、形容詞、副詞などを含む文の各単語を指定・タグ付けするタスクである。
このPOSタグを用いた感性分析は、特定のトピックについて、より広範な大衆の要約を促すのに役立ちます。
論文 参考訳(メタデータ) (2022-05-26T04:40:31Z) - Contrastive Semantic Similarity Learning for Image Captioning Evaluation
with Intrinsic Auto-encoder [52.42057181754076]
自動エンコーダ機構とコントラスト表現学習の進歩により,画像キャプションのための学習基準を提案する。
文レベルの表現を学習するための3つのプログレッシブモデル構造を開発する。
実験結果から,提案手法は他の指標から得られるスコアとよく一致できることが示唆された。
論文 参考訳(メタデータ) (2021-06-29T12:27:05Z) - A Unified Dual-view Model for Review Summarization and Sentiment
Classification with Inconsistency Loss [51.448615489097236]
ユーザーレビューから正確な要約と感情を取得することは、現代のEコマースプラットフォームにとって不可欠な要素である。
本稿では,これら2つのタスクの性能を協調的に改善する新しいデュアルビューモデルを提案する。
異なる領域の4つの実世界のデータセットに対する実験結果から,本モデルの有効性が示された。
論文 参考訳(メタデータ) (2020-06-02T13:34:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。