論文の概要: A Comparison of Automatic Labelling Approaches for Sentiment Analysis
- arxiv url: http://arxiv.org/abs/2211.02976v1
- Date: Sat, 5 Nov 2022 21:41:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 16:18:42.747306
- Title: A Comparison of Automatic Labelling Approaches for Sentiment Analysis
- Title(参考訳): 感情分析のための自動ラベル付け手法の比較
- Authors: Sumana Biswas, Karen Young, and Josephine Griffith
- Abstract要約: 教師付き機械学習モデルの精度は、トレーニング対象のラベル付きデータの品質に強く関係している。
我々は、TextBlob、Vader、Afinnの3つの自動感情ラベル技術を比較した。
その結果, BiLSTM深層学習モデルを用いて, Afinn ラベル法は 80.17% (DS-1) と 80.05% (DS-2) の精度が得られることがわかった。
- 参考スコア(独自算出の注目度): 1.7205106391379026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Labelling a large quantity of social media data for the task of supervised
machine learning is not only time-consuming but also difficult and expensive.
On the other hand, the accuracy of supervised machine learning models is
strongly related to the quality of the labelled data on which they train, and
automatic sentiment labelling techniques could reduce the time and cost of
human labelling. We have compared three automatic sentiment labelling
techniques: TextBlob, Vader, and Afinn to assign sentiments to tweets without
any human assistance. We compare three scenarios: one uses training and testing
datasets with existing ground truth labels; the second experiment uses
automatic labels as training and testing datasets; and the third experiment
uses three automatic labelling techniques to label the training dataset and
uses the ground truth labels for testing. The experiments were evaluated on two
Twitter datasets: SemEval-2013 (DS-1) and SemEval-2016 (DS-2). Results show
that the Afinn labelling technique obtains the highest accuracy of 80.17%
(DS-1) and 80.05% (DS-2) using a BiLSTM deep learning model. These findings
imply that automatic text labelling could provide significant benefits, and
suggest a feasible alternative to the time and cost of human labelling efforts.
- Abstract(参考訳): 大量のソーシャルメディアデータを教師付き機械学習のタスクにラベル付けすることは、時間を要するだけでなく、困難で費用もかかる。
一方で、教師付き機械学習モデルの精度は、トレーニング対象のラベル付きデータの品質に大きく関連しており、自動感情ラベリング技術は、人間のラベル付けの時間とコストを削減できる。
我々は、textblob、vader、afinnの3つの自動感情ラベリング技術を比較し、人間の助けなしにツイートに感情を割り当てた。
第2の実験ではトレーニングとテストのデータセットとして自動ラベルを使用し、第3の実験ではトレーニングデータセットをラベル付けするために3つの自動ラベル付け技術を使用し、テストには地上の真実ラベルを使用します。
実験は、SemEval-2013(DS-1)とSemEval-2016(DS-2)の2つのTwitterデータセットで評価された。
その結果, BiLSTM深層学習モデルを用いて, Afinn ラベル法は 80.17% (DS-1) と 80.05% (DS-2) の精度が得られることがわかった。
これらの結果は、自動テキストラベリングが大きな利点をもたらす可能性を示唆し、人間のラベリングの時間とコストの代替となる可能性が示唆された。
関連論文リスト
- TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - Automatic Labels are as Effective as Manual Labels in Biomedical Images Classification with Deep Learning [32.71326861917332]
特定のタスクを実行するためにディープラーニングアルゴリズムを訓練する主な制限の1つは、医療専門家がデータをラベル付けする必要があることである。
本稿では,全スライド画像(WSI)の分類に基づくDLモデルをトレーニングするために,自動ラベルをどのような状況で適用できるかを検討することを目的とする。
セマンティック・ナレッジ・エクストラクタ・ツール(SKET)アルゴリズムを用いて自動ラベルを生成すると、手動ラベルで得られたものと同等の性能が得られる。
論文 参考訳(メタデータ) (2024-06-20T14:20:50Z) - LABELMAKER: Automatic Semantic Label Generation from RGB-D Trajectories [59.14011485494713]
この研究は、完全に自動化された2D/3Dラベリングフレームワークを導入し、RGB-Dスキャンのラベルを同等(あるいはそれ以上)の精度で生成できる。
我々は、ScanNetデータセットのラベルを大幅に改善し、これまでラベル付けされていなかったARKitScenesデータセットを自動的にラベル付けすることで、LabelMakerパイプラインの有効性を実証する。
論文 参考訳(メタデータ) (2023-11-20T20:40:24Z) - Doubly Robust Self-Training [46.168395767948965]
本稿では,新しい半教師付きアルゴリズムである二重頑健な自己学習を導入する。
通常の自己学習ベースラインよりも2倍頑健な損失の優位性を実証する。
論文 参考訳(メタデータ) (2023-06-01T00:57:16Z) - Teachers in concordance for pseudo-labeling of 3D sequential data [1.1610573589377013]
そこで本研究では,複数の教員を養成することで,教員教育における擬似ラベリング手法の強化を図るために,点雲のシーケンスを活用することを提案する。
Concordanceと呼ばれるこの一連の教師は、標準的な方法よりも高品質な学生教育のための擬似ラベルを提供する。
20%のラベルしか使用していない我々の手法は、完全に教師された手法よりも優れています。
論文 参考訳(メタデータ) (2022-07-13T09:40:22Z) - Semi-supervised Learning using Robust Loss [0.0]
手動ラベル付きデータと追加ラベル付きデータの両方を活用するための半教師付きトレーニング戦略を提案する。
既存の手法とは対照的に、自動ラベル付きデータに対してロバストな損失を適用し、不均一なデータ品質を補う。
提案手法は,画像分類におけるラベルの不均一な品質を補正することにより,モデル性能の向上を図っている。
論文 参考訳(メタデータ) (2022-03-03T05:34:32Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Debiased Pseudo Labeling in Self-Training [77.83549261035277]
ディープニューラルネットワークは、大規模ラベル付きデータセットの助けを借りて、幅広いタスクで顕著なパフォーマンスを達成する。
ラベル付きデータの要求を軽減するため、ラベル付けされていないデータに擬似ラベルを付けることにより、学術と産業の両方で自己学習が広く使われている。
疑似ラベルの生成と利用を2つの独立した頭文字で分離するデバイアスドを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:14:33Z) - Weakly Supervised Pseudo-Label assisted Learning for ALS Point Cloud
Semantic Segmentation [1.4620086904601473]
競合ポイントクラウドの結果は通常、大量のラベル付きデータに依存します。
本研究では,基礎的事実を限定した正確な結果を得るための擬似ラベル方式を提案する。
論文 参考訳(メタデータ) (2021-05-05T08:07:21Z) - Self-Tuning for Data-Efficient Deep Learning [75.34320911480008]
セルフチューニングは、データ効率のよいディープラーニングを可能にする新しいアプローチである。
ラベル付きおよびラベルなしデータの探索と事前訓練されたモデルの転送を統一する。
SSLとTLの5つのタスクをシャープなマージンで上回ります。
論文 参考訳(メタデータ) (2021-02-25T14:56:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。