論文の概要: A Few Topical Tweets are Enough for Effective User-Level Stance
Detection
- arxiv url: http://arxiv.org/abs/2004.03485v1
- Date: Tue, 7 Apr 2020 15:35:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 00:34:00.438996
- Title: A Few Topical Tweets are Enough for Effective User-Level Stance
Detection
- Title(参考訳): ユーザーレベルスタンス検出に十分なトピカルツイートがいくつかある
- Authors: Younes Samih and Kareem Darwish
- Abstract要約: 我々は2つのアプローチを用いて声帯Twitterユーザーのスタンス検出に取り組む。
第1のアプローチでは、コンテキスト化埋め込みを用いてツイートを表現することで、ユーザレベルのスタンス検出を改善する。
第2のアプローチでは、あるユーザのつぶやきをTwitterのタイムラインのつぶやきを使って拡張し、ユーザを教師なしで分類する。
- 参考スコア(独自算出の注目度): 8.118808561953514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stance detection entails ascertaining the position of a user towards a
target, such as an entity, topic, or claim. Recent work that employs
unsupervised classification has shown that performing stance detection on vocal
Twitter users, who have many tweets on a target, can yield very high accuracy
(+98%). However, such methods perform poorly or fail completely for less vocal
users, who may have authored only a few tweets about a target. In this paper,
we tackle stance detection for such users using two approaches. In the first
approach, we improve user-level stance detection by representing tweets using
contextualized embeddings, which capture latent meanings of words in context.
We show that this approach outperforms two strong baselines and achieves 89.6%
accuracy and 91.3% macro F-measure on eight controversial topics. In the second
approach, we expand the tweets of a given user using their Twitter timeline
tweets, and then we perform unsupervised classification of the user, which
entails clustering a user with other users in the training set. This approach
achieves 95.6% accuracy and 93.1% macro F-measure.
- Abstract(参考訳): スタンス検出は、エンティティ、トピック、クレームなどのターゲットに対するユーザの位置を確認することを必要とする。
教師なし分類を用いた最近の研究は、ターゲットに多くのツイートがあるボイスTwitterユーザーに対してスタンス検出を行うと、非常に高い精度(+98%)が得られることを示している。
しかし、このような手法は、ターゲットに関するほんの数ツイートしか投稿していない声の少ないユーザーにとっては、パフォーマンスが悪く、あるいは完全に失敗する。
本稿では,このようなユーザの姿勢検出に2つのアプローチを用いて取り組む。
第1のアプローチでは,単語の潜在的意味をコンテキスト内にキャプチャするコンテキスト化埋め込みを用いて,ツイートを表現することで,ユーザレベルのスタンス検出を改善する。
提案手法は2つの強いベースラインを上回り,89.6%の精度,91.3%のマクロF尺度を8つの議論の的となっている。
第2のアプローチでは、Twitterタイムラインのつぶやきを使用して、特定のユーザのつぶやきを拡張し、トレーニングセット内の他のユーザとのクラスタリングを含む、教師なしのユーザ分類を実行します。
このアプローチは95.6%の精度と93.1%のマクロF測定を実現する。
関連論文リスト
- Real-Time Summarization of Twitter [9.034423337410274]
我々は、リアルタイムプッシュ通知のシナリオに焦点を当て、システムはサンプルツイートのストリームを監視し、特定の興味のあるプロフィールに関連するつぶやきを返す必要がある。
ツイートが特定の関心プロファイルに関連するかどうかを分類するために、Dirichletスコアと、非常にスムーズな(ベースライン)で採用しています。
また、プッシュキューから冗長なツイートを削除することも望まれる。
論文 参考訳(メタデータ) (2024-07-11T01:56:31Z) - Machine and Deep Learning Applications to Mouse Dynamics for Continuous
User Authentication [0.0]
この記事では,3つの機械学習アルゴリズムとディープラーニングアルゴリズムを使用して,40人のユーザのデータセットを評価することで,これまでの公開作業に基づいています。
トップパフォーマーは1次元畳み込みニューラルネットワークであり、トップ10ユーザーの平均テスト精度は85.73%である。
また, 92.48%のピーク精度に達する人工ニューラルネットワークを用いて, マルチクラス分類についても検討した。
論文 参考訳(メタデータ) (2022-05-26T21:43:59Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - Semi-supervised Stance Detection of Tweets Via Distant Network
Supervision [32.86421107987556]
ソーシャルネットワーク上のホモフィリーな特性は、粗いユーザーレベルのスタンスを示す強いシグナルを与える。
我々は、新しい半教師付きスタンス検出器であるSANDSを紹介する。
Sandsは、米国(インド)ベースのデータセットで0.55(0.49)のマクロF1スコアを達成した。
論文 参考訳(メタデータ) (2022-01-03T13:04:54Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Automatic Expansion and Retargeting of Arabic Offensive Language
Training [12.111859709582617]
当社は2つの重要な洞察を取り入れている。つまり、Twitter上のリプライがしばしば反対を示唆し、一部のアカウントは特定のターゲットに対して攻撃的であることに固執している。
本手法はアラビア語のツイートに対して13%と79%の相対的なF1尺度が有効であることを示す。
論文 参考訳(メタデータ) (2021-11-18T08:25:09Z) - Detection of Adversarial Supports in Few-shot Classifiers Using Feature
Preserving Autoencoders and Self-Similarity [89.26308254637702]
敵対的なサポートセットを強調するための検出戦略を提案する。
我々は,特徴保存型オートエンコーダフィルタリングと,この検出を行うサポートセットの自己相似性の概念を利用する。
提案手法は攻撃非依存であり, 最善の知識まで, 数発分類器の検出を探索する最初の方法である。
論文 参考訳(メタデータ) (2020-12-09T14:13:41Z) - Writer Identification Using Microblogging Texts for Social Media
Forensics [53.180678723280145]
私たちは、文学的分析に広く使われている人気のあるスタイル的特徴と、URL、ハッシュタグ、返信、引用などの特定のTwitter機能を評価します。
我々は、様々なサイズの著者集合と、著者毎のトレーニング/テストテキストの量をテストする。
論文 参考訳(メタデータ) (2020-07-31T00:23:18Z) - Forensic Authorship Analysis of Microblogging Texts Using N-Grams and
Stylometric Features [63.48764893706088]
この研究は、280文字に制限されたツイートメッセージの作者を特定することを目的としている。
弊社の実験では、40名のユーザによる、ユーザ毎120から200のつぶやきを自己キャプチャしたデータベースを使っています。
この小さなセットを使った結果は有望であり、異なる特徴は92%から98.5%の分類精度を提供する。
論文 参考訳(メタデータ) (2020-03-24T19:32:11Z) - Investigating Classification Techniques with Feature Selection For
Intention Mining From Twitter Feed [0.0]
マイクロブログサービスのTwitterには2億人以上の登録ユーザーがいて、1日に6500万以上の投稿をやりとりしている。
ほとんどのツイートは非公式に書かれ、しばしばスラング語で書かれている。
本稿では,Twitterフィードからユーザの意図を抽出する機能の選択の問題について検討する。
論文 参考訳(メタデータ) (2020-01-22T11:55:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。