論文の概要: Tweet Sentiment Quantification: An Experimental Re-Evaluation
- arxiv url: http://arxiv.org/abs/2011.08091v3
- Date: Sat, 18 Sep 2021 00:07:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 21:21:41.503394
- Title: Tweet Sentiment Quantification: An Experimental Re-Evaluation
- Title(参考訳): Tweet Sentimentの定量化:実験的な再評価
- Authors: Alejandro Moreo and Fabrizio Sebastiani
- Abstract要約: センチメント定量化(Sentiment Quantification)は、教師付き学習によって、感情関連クラスの相対周波数(prevalence')を推定するタスクである。
統合され、より堅牢な実験プロトコルに従って、これらの定量化手法を再評価する。
結果はガオ・ガオ・セバスティアーニ(Gao Gao Sebastiani)によって得られたものとは大きく異なり、異なる感情量化法の相対的な強さと弱さについて、よりしっかりとした理解を提供する。
- 参考スコア(独自算出の注目度): 88.60021378715636
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sentiment quantification is the task of training, by means of supervised
learning, estimators of the relative frequency (also called ``prevalence'') of
sentiment-related classes (such as \textsf{Positive}, \textsf{Neutral},
\textsf{Negative}) in a sample of unlabelled texts. This task is especially
important when these texts are tweets, since the final goal of most sentiment
classification efforts carried out on Twitter data is actually quantification
(and not the classification of individual tweets). It is well-known that
solving quantification by means of ``classify and count'' (i.e., by classifying
all unlabelled items by means of a standard classifier and counting the items
that have been assigned to a given class) is less than optimal in terms of
accuracy, and that more accurate quantification methods exist. Gao and
Sebastiani (2016) carried out a systematic comparison of quantification methods
on the task of tweet sentiment quantification. In hindsight, we observe that
the experimental protocol followed in that work was weak, and that the
reliability of the conclusions that were drawn from the results is thus
questionable. We now re-evaluate those quantification methods (plus a few more
modern ones) on exactly the same same datasets, this time following a now
consolidated and much more robust experimental protocol (which also involves
simulating the presence, in the test data, of class prevalence values very
different from those of the training set). This experimental protocol (even
without counting the newly added methods) involves a number of experiments
5,775 times larger than that of the original study. The results of our
experiments are dramatically different from those obtained by Gao and
Sebastiani, and they provide a different, much more solid understanding of the
relative strengths and weaknesses of different sentiment quantification
methods.
- Abstract(参考訳): 感情の定量化は、教師付き学習(supervised learning)によって、非ラベルテキストのサンプルにおける感情関連クラス(例えば、 \textsf{positive}, \textsf{neutral}, \textsf{ negative})の相対周波数(`prevalence')の推定子を訓練するタスクである。
このタスクは、これらのテキストがつぶやきである場合に特に重要であり、Twitterデータ上で行われている感情分類の最終目標は、実際に定量化である(個々のつぶやきの分類ではない)。
例えば、標準分類器(英語版)を用いて全ての非競合項目を分類し、与えられたクラスに割り当てられた項目を数えることによって)による量子化の解法は、精度の点で最適ではなく、より正確な定量化方法が存在することはよく知られている。
Gao と Sebastiani (2016) は、ツイート感情定量化タスクにおける定量化手法の体系的比較を行った。
この結果から得られた結果の信頼性が疑わしいことが示唆された。
今回は、統合され、より堅牢な実験プロトコル(テストデータでは、トレーニングセットと非常に異なるクラスの有病率値の存在をシミュレートすることを含む)に従って、まったく同じデータセット上で、これらの定量化方法(さらに、より現代的なもの)を再評価します。
この実験プロトコルは(新たに追加された手法を数えることなく)、元の研究よりも5,775倍大きな実験を含む。
実験の結果はガオとセバスティアンによって得られたものとは大きく異なり、異なる感情量化法の相対的な強さと弱点について、よりしっかりとした理解を提供する。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Multi-Label Quantification [78.83284164605473]
定量化とは、教師なしデータサンプルにおいて、興味あるクラスの相対周波数の予測子を生成する教師付き学習課題である。
本研究では,その相対頻度をより正確に予測するために,興味あるクラス間の依存関係を活用しようとするクラス有病率値の推定手法を提案する。
論文 参考訳(メタデータ) (2022-11-15T11:29:59Z) - Estimating Confidence of Predictions of Individual Classifiers and Their
Ensembles for the Genre Classification Task [0.0]
Genre IDは、非トピックテキスト分類のサブクラスである。
BERTやXLM-RoBERTaのような事前訓練されたトランスフォーマーに基づく神経モデルは、多くのNLPタスクにおいてSOTA結果を示す。
論文 参考訳(メタデータ) (2022-06-15T09:59:05Z) - On Quantitative Evaluations of Counterfactuals [88.42660013773647]
本稿では、分析と実験を通じて、視覚的対実例の評価に関する研究を集約する。
ほとんどのメトリクスは、十分な単純なデータセットを意図して振る舞うが、複雑さが増加すると、良い結果と悪い結果の違いを判断できないものもいる。
私たちはラベル変動スコアとOracleスコアという2つの新しい指標を提案しています。
論文 参考訳(メタデータ) (2021-10-30T05:00:36Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - Identifying Spurious Correlations for Robust Text Classification [9.457737910527829]
そこで本研究では,テキスト分類におけるスプリアスと真の相関を区別する手法を提案する。
我々は、治療効果推定器から得られる特徴を用いて、突発的な相関を「遺伝子」と区別する。
4つのデータセットの実験は、このアプローチを使って特徴の選択を知らせることが、より堅牢な分類につながることを示唆している。
論文 参考訳(メタデータ) (2020-10-06T03:49:22Z) - Cooperative Bi-path Metric for Few-shot Learning [50.98891758059389]
数発の分類問題の調査に2つの貢献をしている。
本稿では,従来の教師あり学習法において,ベースクラスで訓練されたシンプルで効果的なベースラインについて報告する。
本稿では, 基礎クラスと新しいクラス間の相関を利用して, 精度の向上を図る, 分類のための協調的二経路計量を提案する。
論文 参考訳(メタデータ) (2020-08-10T11:28:52Z) - Quantifying With Only Positive Training Data [0.5735035463793008]
定量化 (quantification) は、ラベルなしサンプルにおいて各クラスに属するデータポイント数をカウントする方法を研究する研究分野である。
この記事では、ポジティブとアンラベルラーニング(PUL)とワンクラスの量子化(OCQ)のギャップを埋める。
提案手法であるパッシブ・アグレッシブ・スレッショルド(PAT)とPUL法を比較し,PATが一般に最も高速かつ高精度なアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-04-22T01:18:25Z) - An interpretable semi-supervised classifier using two different
strategies for amended self-labeling [0.0]
半教師付き分類技術は、学習期間中にラベル付きデータとラベルなしデータを組み合わせる。
ブラックボックスを用いて,不足するクラスラベルとホワイトボックスを推定し,最終的な予測を説明する,解釈可能な自己ラベル付きグレーボックス分類器を提案する。
論文 参考訳(メタデータ) (2020-01-26T19:37:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。