論文の概要: A Weakly Supervised Approach for Classifying Stance in Twitter Replies
- arxiv url: http://arxiv.org/abs/2103.07098v1
- Date: Fri, 12 Mar 2021 06:02:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-15 22:04:39.251235
- Title: A Weakly Supervised Approach for Classifying Stance in Twitter Replies
- Title(参考訳): Twitterの返信のスタンスを分類するアプローチ
- Authors: Sumeet Kumar, Ramon Villa Cox, Matthew Babcock, Kathleen M. Carley
- Abstract要約: オンライン会話では敵の反応が一般的である。
これらの不利な見解(あるいは姿勢)を返信文から推測することは困難である。
我々は,twitter応答におけるスタンスを予測するための弱い教師付きアプローチを提案する。
- 参考スコア(独自算出の注目度): 11.139350549173953
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conversations on social media (SM) are increasingly being used to investigate
social issues on the web, such as online harassment and rumor spread. For such
issues, a common thread of research uses adversarial reactions, e.g., replies
pointing out factual inaccuracies in rumors. Though adversarial reactions are
prevalent in online conversations, inferring those adverse views (or stance)
from the text in replies is difficult and requires complex natural language
processing (NLP) models. Moreover, conventional NLP models for stance mining
need labeled data for supervised learning. Getting labeled conversations can
itself be challenging as conversations can be on any topic, and topics change
over time. These challenges make learning the stance a difficult NLP problem.
In this research, we first create a new stance dataset comprised of three
different topics by labeling both users' opinions on the topics (as in pro/con)
and users' stance while replying to others' posts (as in favor/oppose). As we
find limitations with supervised approaches, we propose a weakly-supervised
approach to predict the stance in Twitter replies. Our novel method allows
using a smaller number of hashtags to generate weak labels for Twitter replies.
Compared to supervised learning, our method improves the mean F1-macro by 8\%
on the hand-labeled dataset without using any hand-labeled examples in the
training set. We further show the applicability of our proposed method on COVID
19 related conversations on Twitter.
- Abstract(参考訳): ソーシャルメディア(SM)に関する議論は、オンラインハラスメントや噂の拡散など、ウェブ上の社会問題の調査にますます利用されている。
このような問題に対して、共通の研究のスレッドは、例えば、噂の事実的不正確さを指摘する返信など、逆反応を使用する。
敵の反応はオンライン会話で広く見られるが、これらの不利な見解(あるいは姿勢)を回答中のテキストから推測することは困難であり、複雑な自然言語処理(nlp)モデルを必要とする。
さらに,従来のNLPモデルでは,教師あり学習のためのラベル付きデータが必要である。
ラベル付き会話は、どんなトピックでも会話ができるので、それ自体が困難であり、トピックは時間とともに変化する。
これらの課題は、姿勢の学習を困難なNLP問題にする。
本研究では,各トピックに対するユーザの意見(プロ/コンなど)と,他の投稿(好意的/好意的)に対するユーザのスタンスの両方をラベル付けして,3つの異なるトピックからなる新しいスタンスデータセットを作成する。
教師付きアプローチによる制限を見つけるため,Twitter応答の姿勢を予測する弱教師付きアプローチを提案する。
提案手法では,少数のハッシュタグを用いてTwitter応答の弱いラベルを生成することができる。
教師付き学習と比較して,トレーニングセットに手作業による例を使わずに,手作業によるデータセットの平均F1-macroを8\%改善する。
さらに,提案手法のtwitter上でのcovid-19関連会話への適用性を示す。
関連論文リスト
- NLP for Counterspeech against Hate: A Survey and How-To Guide [11.696212004806263]
本稿では, 対訳研究のガイドとして, 具体例を詳述し, 実施すべきステップについて述べる。
NLPにおける対音声研究の課題と今後の方向性について論じる。
論文 参考訳(メタデータ) (2024-03-29T10:32:44Z) - AutoConv: Automatically Generating Information-seeking Conversations
with Large Language Models [74.10293412011455]
合成会話生成のためのAutoConvを提案する。
具体的には,会話生成問題を言語モデリングタスクとして定式化する。
我々は、情報探索プロセスの特徴を捉えるために、人間同士の会話でLLMを微調整する。
論文 参考訳(メタデータ) (2023-08-12T08:52:40Z) - NewsDialogues: Towards Proactive News Grounded Conversation [72.10055780635625]
本稿では,対話システムがニュースの重要な話題に基づいて会話を積極的にリードする新しいタスク,Proactive News Grounded Conversationを提案する。
この課題をさらに発展させるために、人間と人間の対話データセットtsNewsDialoguesを収集し、合計14.6Kの発話を含む1Kの会話を含む。
論文 参考訳(メタデータ) (2023-08-12T08:33:42Z) - Learning Stance Embeddings from Signed Social Graphs [7.202476284052426]
ソーシャルネットワーク分析における重要な課題は、大量のトピックについて、グラフ内の人々の位置や姿勢を理解することである。
本研究では,サイン付きソーシャルグラフにおける各ユーザとトピックの埋め込みを共同で学習するStance Embeddings Modelを提案する。
SEMはコールドスタートトピックのスタンス検出を行うことができ、ユーザのエンゲージメントを観察していないトピックに対するスタンスを予測できる。
論文 参考訳(メタデータ) (2022-01-27T17:22:49Z) - Findings on Conversation Disentanglement [28.874162427052905]
発話から発話への分類と発話からスレッドへの分類を学習する学習モデルを構築した。
Ubuntu IRCデータセットの実験は、このアプローチが従来の欲求的アプローチを上回る可能性があることを示している。
論文 参考訳(メタデータ) (2021-12-10T05:54:48Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Disentangling Online Chats with DAG-Structured LSTMs [55.33014148383343]
DAG-LSTMはTree-LSTMの一般化であり、間接的な非循環的依存関係を処理できる。
提案する新モデルでは,リプライ・トゥ・リレーション(Repend-to-Relation)を回復する作業において,アート・ステータスの状態を達成できることが示される。
論文 参考訳(メタデータ) (2021-06-16T18:00:00Z) - Response Selection for Multi-Party Conversations with Dynamic Topic
Tracking [63.15158355071206]
我々は、応答と関連する会話コンテキストの間のトピックを一致させるために、動的トピック追跡タスクとして応答選択をフレーム化する。
本研究では,大規模な事前学習モデルによる効率的な符号化を支援する新しいマルチタスク学習フレームワークを提案する。
DSTC-8 Ubuntu IRCデータセットの実験結果は、応答選択とトピックのアンタングル化タスクにおける最先端の結果を示している。
論文 参考訳(メタデータ) (2020-10-15T14:21:38Z) - ConvAI3: Generating Clarifying Questions for Open-Domain Dialogue
Systems (ClariQ) [64.60303062063663]
本論文では,対話システムに対する質問の明確化に関する課題について詳述する(ClariQ)。
このチャレンジは、2020年のSearch Oriented Conversational AI (SCAI) EMNLPワークショップで、ConvAI3(Conversational AI Challenge series)の一部として組織されている。
論文 参考訳(メタデータ) (2020-09-23T19:48:02Z) - Through the Twitter Glass: Detecting Questions in Micro-Text [0.0]
別の調査では、Twitter上での人々のQ&A習慣を理解することに興味がありました。
Twitter内で質問を見つけることは難しい課題であることが判明したので、従来のNLPアプローチを問題に適用することを検討しました。
この研究はまだ予備的ですが、本稿では、私たちが使ったテクニックと学んだ教訓について論じます。
論文 参考訳(メタデータ) (2020-06-13T22:34:01Z) - Stance in Replies and Quotes (SRQ): A New Dataset For Learning Stance in
Twitter Conversations [8.097870074875729]
我々は5200以上のスタンスラベルを持つTwitter会話のための人間ラベル付きスタンスデータセットを提示する。
会話の姿勢を学習し、様々なモデルのパフォーマンスを比較するためのベースラインモデルが多数含まれています。
論文 参考訳(メタデータ) (2020-06-01T03:30:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。