論文の概要: TwiBot-22: Towards Graph-Based Twitter Bot Detection
- arxiv url: http://arxiv.org/abs/2206.04564v2
- Date: Sun, 12 Jun 2022 09:05:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-14 11:19:18.195948
- Title: TwiBot-22: Towards Graph-Based Twitter Bot Detection
- Title(参考訳): TwiBot-22: グラフベースのTwitterボット検出を目指す
- Authors: Shangbin Feng, Zhaoxuan Tan, Herun Wan, Ningnan Wang, Zilong Chen,
Binchi Zhang, Qinghua Zheng, Wenqian Zhang, Zhenyu Lei, Shujie Yang, Xinshun
Feng, Qingyue Zhang, Hongrui Wang, Yuhan Liu, Yuyang Bai, Heng Wang, Zijian
Cai, Yanbo Wang, Lijing Zheng, Zihan Ma, Jundong Li, Minnan Luo
- Abstract要約: TwiBot-22はグラフベースのTwitterボット検出ベンチマークで、これまでで最大のデータセットを示している。
35の代表的なTwitterボット検出ベースラインを再実装し、TwiBot-22を含む9つのデータセットで評価します。
さらなる研究を容易にするため、実装済みのコードとデータセットをTwiBot-22評価フレームワークに統合する。
- 参考スコア(独自算出の注目度): 39.359825215347655
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Twitter bot detection has become an increasingly important task to combat
misinformation, facilitate social media moderation, and preserve the integrity
of the online discourse. State-of-the-art bot detection methods generally
leverage the graph structure of the Twitter network, and they exhibit promising
performance when confronting novel Twitter bots that traditional methods fail
to detect. However, very few of the existing Twitter bot detection datasets are
graph-based, and even these few graph-based datasets suffer from limited
dataset scale, incomplete graph structure, as well as low annotation quality.
In fact, the lack of a large-scale graph-based Twitter bot detection benchmark
that addresses these issues has seriously hindered the development and
evaluation of novel graph-based bot detection approaches. In this paper, we
propose TwiBot-22, a comprehensive graph-based Twitter bot detection benchmark
that presents the largest dataset to date, provides diversified entities and
relations on the Twitter network, and has considerably better annotation
quality than existing datasets. In addition, we re-implement 35 representative
Twitter bot detection baselines and evaluate them on 9 datasets, including
TwiBot-22, to promote a fair comparison of model performance and a holistic
understanding of research progress. To facilitate further research, we
consolidate all implemented codes and datasets into the TwiBot-22 evaluation
framework, where researchers could consistently evaluate new models and
datasets. The TwiBot-22 Twitter bot detection benchmark and evaluation
framework are publicly available at https://twibot22.github.io/
- Abstract(参考訳): Twitterのボット検出は、誤情報に対処し、ソーシャルメディアのモデレーションを促進し、オンライン会話の完全性を維持するためにますます重要になっている。
最先端のボット検出手法は、一般的にtwitterネットワークのグラフ構造を利用しており、従来の方法では検出できない新しいtwitterボットに直面すると有望な性能を発揮する。
しかし、既存のtwitterボット検出データセットのほとんどがグラフベースであり、これらのグラフベースデータセットでさえも、データセットスケールの制限、不完全なグラフ構造、アノテーション品質の低下に悩まされている。
実際、これらの問題に対処する大規模なグラフベースのtwitterボット検出ベンチマークの欠如は、グラフベースの新しいボット検出アプローチの開発と評価を深刻な障害にしている。
本稿では,グラフベースのTwitterボット検出ベンチマークであるTwiBot-22を提案する。このベンチマークは,これまでで最大のデータセットを示し,Twitterネットワーク上で多様なエンティティと関係を提供し,既存のデータセットよりもはるかに優れたアノテーション品質を有する。
さらに、35の代表的なtwitterボット検出ベースラインを再実装し、twibot-22を含む9つのデータセットで評価し、モデル性能と研究進捗の全体的理解を公平に比較した。
さらなる研究を容易にするために、実装されたすべてのコードとデータセットをtwibot-22評価フレームワークに統合し、研究者が新しいモデルとデータセットを一貫して評価できるようにしました。
twibot-22 twitter bot detection benchmark and evaluation frameworkはhttps://twibot22.github.io/で公開されている。
関連論文リスト
- My Brother Helps Me: Node Injection Based Adversarial Attack on Social Bot Detection [69.99192868521564]
Twitterのようなソーシャルプラットフォームは、数多くの不正なユーザーから包囲されている。
ソーシャルネットワークの構造のため、ほとんどの手法は攻撃を受けやすいグラフニューラルネットワーク(GNN)に基づいている。
本稿では,ボット検出モデルを欺いたノードインジェクションに基づく逆攻撃手法を提案する。
論文 参考訳(メタデータ) (2023-10-11T03:09:48Z) - LMBot: Distilling Graph Knowledge into Language Model for Graph-less
Deployment in Twitter Bot Detection [41.043975659303435]
グラフニューラルネットワーク(GNN)の知識を言語モデル(LM)に抽出する新しいボット検出フレームワークLMBotを提案する。
グラフベースのデータセットでは、LMの出力はGNNの入力機能を提供し、ボットの検出と知識の抽出を反復的かつ相互に強化するプロセスでLMに戻すことができる。
実験の結果,LMBotは4つのTwitterボット検出ベンチマークで最先端のパフォーマンスを実現していることがわかった。
論文 参考訳(メタデータ) (2023-06-30T05:50:26Z) - BotArtist: Generic approach for bot detection in Twitter via semi-automatic machine learning pipeline [47.61306219245444]
Twitterは、ボットや偽アカウントのターゲットとなり、偽情報や操作の拡散につながった。
本稿では,機械学習モデル開発に関連する課題に対処するために,セミオートマチック機械学習パイプライン(SAMLP)を提案する。
ユーザプロファイル機能に基づいたボット検出モデルBotArtistを開発した。
論文 参考訳(メタデータ) (2023-05-31T09:12:35Z) - Machine Learning-based Automatic Annotation and Detection of COVID-19
Fake News [8.020736472947581]
新型コロナウイルス(COVID-19)は世界のあらゆる地域に影響を与えるが、感染の誤報はウイルスよりも速く移動した。
既存の作業は、拡散の触媒として働くボットの存在を無視する。
そこで本稿では,Twitterデータセット上で事実確認文をラベル付けする手法を提案する。
論文 参考訳(メタデータ) (2022-09-07T13:55:59Z) - BIC: Twitter Bot Detection with Text-Graph Interaction and Semantic
Consistency [22.52777462831911]
テキストとグラフのモダリティを深くインタラクティブにし、ツイートの意味的矛盾を検知するBICという新しいモデルを提案する。
BICには、ツイートからセマンティック一貫性情報を学ぶためのセマンティック一貫性検出モジュールが含まれている。
われわれのフレームワークは、総合的なTwitterボットベンチマークの競争ベースラインを上回っている。
論文 参考訳(メタデータ) (2022-08-17T14:34:40Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Detection of Novel Social Bots by Ensembles of Specialized Classifiers [60.63582690037839]
悪意ある俳優は、社会ボットとして知られるアルゴリズムによって部分的に制御される不正なソーシャルメディアアカウントを作成し、誤情報を広め、オンラインでの議論を扇動する。
異なるタイプのボットが、異なる行動特徴によって特徴づけられることを示す。
本稿では,ボットのクラスごとに専門的な分類器を訓練し,それらの決定を最大ルールで組み合わせる,教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-11T22:59:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。