論文の概要: Investigating label suggestions for opinion mining in German Covid-19
social media
- arxiv url: http://arxiv.org/abs/2105.12980v1
- Date: Thu, 27 May 2021 07:47:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-28 16:26:40.040639
- Title: Investigating label suggestions for opinion mining in German Covid-19
social media
- Title(参考訳): ドイツ・コビッドのソーシャルメディアにおける意見マイニングのためのラベル提案の検討
- Authors: Tilman Beck, Ji-Ung Lee, Christina Viehmann, Marcus Maurer, Oliver
Quiring, Iryna Gurevych
- Abstract要約: 我々は,社会科学の学生を対象に,制御された注釈研究を行うためのガイドラインを策定する。
私たちは、専門家が注釈付けした小さなデータセットでトレーニングされたモデルからの提案が、すでに大幅に改善されていることに気付きました。
提案バイアスの分析から,アノテータは一般に提案されたラベルを反映できることが明らかとなった。
- 参考スコア(独自算出の注目度): 41.89305442562581
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work investigates the use of interactively updated label suggestions to
improve upon the efficiency of gathering annotations on the task of opinion
mining in German Covid-19 social media data. We develop guidelines to conduct a
controlled annotation study with social science students and find that
suggestions from a model trained on a small, expert-annotated dataset already
lead to a substantial improvement - in terms of inter-annotator agreement(+.14
Fleiss' $\kappa$) and annotation quality - compared to students that do not
receive any label suggestions. We further find that label suggestions from
interactively trained models do not lead to an improvement over suggestions
from a static model. Nonetheless, our analysis of suggestion bias shows that
annotators remain capable of reflecting upon the suggested label in general.
Finally, we confirm the quality of the annotated data in transfer learning
experiments between different annotator groups. To facilitate further research
in opinion mining on social media data, we release our collected data
consisting of 200 expert and 2,785 student annotations.
- Abstract(参考訳): 本研究は,ドイツ・コビッド19のソーシャルメディアデータにおける意見マイニング作業におけるアノテーション収集の効率向上のために,インタラクティブに更新されたラベル提案を使用することを検討する。
社会科の学生とのアノテーション研究の指導を行うためのガイドラインを開発し、専門家による小さなデータセットでトレーニングされたモデルからの提案は、アノテーション間の合意(+.14 fleiss' $\kappa$)とアノテーションの品質に関して、ラベルの推奨を受けていない学生と比較して、すでに大幅に改善されていることを見出します。
さらに、インタラクティブにトレーニングされたモデルからのラベル提案は、静的モデルからの提案よりも改善しないことがわかった。
それにもかかわらず、提案バイアスの分析は、アノテータが一般に提案されたラベルを反映できることを示す。
最後に,異なるアノテータ群間でのトランスファー学習実験において,アノテートデータの品質を確認する。
ソーシャルメディアデータに対する意見マイニングのさらなる研究を促進するために,200名と2,785名の学生アノテーションからなる収集データをリリースする。
関連論文リスト
- RevGNN: Negative Sampling Enhanced Contrastive Graph Learning for Academic Reviewer Recommendation [19.849407224993506]
本研究は,学術レビュアー推薦における未観測相互作用のあいまいさに対処することを目的としている。
RevGNNは、Pseudo Neg-Labelを使って科学的知識と行動の両方を符号化し、レビューの好みを近似する2段階エンコーダ構造を採用している。
論文 参考訳(メタデータ) (2024-07-30T09:25:40Z) - Capturing Perspectives of Crowdsourced Annotators in Subjective Learning Tasks [9.110872603799839]
監督された分類は、人間によって注釈付けされたデータセットに大きく依存する。
毒性分類などの主観的なタスクでは、これらのアノテーションはラッカー間での合意が低くなることが多い。
本研究では、主観的分類タスクのためのtextbfAnnotator Awares for Texts (AART) を提案する。
論文 参考訳(メタデータ) (2023-11-16T10:18:32Z) - Label Matching Semi-Supervised Object Detection [85.99282969977541]
半教師対象検出は,教師主導型自己学習の開発において大きな進歩を遂げている。
ラベルミスマッチ問題は、以前の研究でまだ完全に解明されていないため、自己学習中に重大な確証バイアスが生じる。
本稿では,2つの異なる相補的視点から,単純かつ効果的な LabelMatch フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-14T05:59:41Z) - Annotation Error Detection: Analyzing the Past and Present for a More
Coherent Future [63.99570204416711]
我々は、潜在的なアノテーションの誤りを検知するための18の手法を再実装し、9つの英語データセット上で評価する。
アノテーションエラー検出タスクの新しい形式化を含む一様評価設定を定義する。
私たちはデータセットと実装を,使いやすく,オープンソースのソフトウェアパッケージとしてリリースしています。
論文 参考訳(メタデータ) (2022-06-05T22:31:45Z) - Dynamic Supervisor for Cross-dataset Object Detection [52.95818230087297]
オブジェクト検出タスクにおけるデータセット間のトレーニングは、データセットにまたがるカテゴリ内の不整合が、完全に教師付き学習を半教師付き学習に変換するため、複雑である。
本稿では,ハードラベルとソフトラベルを併用した複数更新サブモデルを用いて,アノテーションを複数回更新する動的スーパーバイザフレームワークを提案する。
最終生成アノテーションでは、ハードラベルトレーニングとソフトラベルトレーニングを統合することで、リコールと精度が大幅に向上した。
論文 参考訳(メタデータ) (2022-04-01T03:18:46Z) - SURF: Semi-supervised Reward Learning with Data Augmentation for
Feedback-efficient Preference-based Reinforcement Learning [168.89470249446023]
我々は、大量のラベルなしサンプルとデータ拡張を利用する半教師付き報酬学習フレームワークSURFを提案する。
報奨学習にラベルのないサンプルを活用するために,選好予測器の信頼性に基づいてラベルのないサンプルの擬似ラベルを推定する。
本実験は, ロボット操作作業における嗜好に基づく手法のフィードバック効率を有意に向上させることを実証した。
論文 参考訳(メタデータ) (2022-03-18T16:50:38Z) - A Semi-Supervised Learning Approach with Two Teachers to Improve
Breakdown Identification in Dialogues [25.499578161686355]
そこで我々は,この課題に対処するために,教師・教師・学生を対象とした新しい学習フレームワークを提案する。
本稿では,ラベル付きデータと乱ラベル付きデータで学習した教師を2名紹介する。
我々は、未ラベルデータを活用して、未ラベルデータのラベル付けを洗練させるために2人の教師を雇う学生教育における分類を改善する。
論文 参考訳(メタデータ) (2022-02-22T14:39:51Z) - Near-Zero-Shot Suggestion Mining with a Little Help from WordNet [7.928003786376715]
ラベルが不明瞭な方法で提案分類を行うために,いくつかのエンテーメントに基づくゼロショット手法を提示し,評価する。
本稿では,ユーザ意図で英語の文に目的のクラスラベルを割り当てる戦略を紹介し,予測品質を著しく向上させる。
論文 参考訳(メタデータ) (2021-11-25T07:40:45Z) - Annotation Curricula to Implicitly Train Non-Expert Annotators [56.67768938052715]
自発的な研究は、しばしば、アノテータがタスク、そのアノテーションスキーム、およびデータドメインに精通することを要求する。
これは最初は圧倒的であり、精神的に課税され、結果として生じるアノテーションにエラーを誘導する。
暗黙的にアノテータを訓練する新しい手法であるアノテーションキュリキュラを提案する。
論文 参考訳(メタデータ) (2021-06-04T09:48:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。