論文の概要: MGTAB: A Multi-Relational Graph-Based Twitter Account Detection
Benchmark
- arxiv url: http://arxiv.org/abs/2301.01123v1
- Date: Tue, 3 Jan 2023 14:43:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 14:39:34.576475
- Title: MGTAB: A Multi-Relational Graph-Based Twitter Account Detection
Benchmark
- Title(参考訳): MGTAB:マルチリレーショナルグラフベースのTwitterアカウント検出ベンチマーク
- Authors: Shuhao Shi, Kai Qiao, Jian Chen, Shuai Yang, Jie Yang, Baojie Song,
Linyuan Wang, Bin Yan
- Abstract要約: マルチリレーショナルグラフベースのTwitterアカウント検出ベンチマーク(MGTAB)を提案する。
MGTABには10,199名のエキスパートアノテートユーザと7種類の関係があり、高品質なアノテーションと多様な関係が保証されている。
実験の結果,グラフベースのアプローチは機能ベースのアプローチよりも一般的に有効であり,複数の関係を導入する際の性能が向上することがわかった。
- 参考スコア(独自算出の注目度): 14.91754326735955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of social media user stance detection and bot detection
methods rely heavily on large-scale and high-quality benchmarks. However, in
addition to low annotation quality, existing benchmarks generally have
incomplete user relationships, suppressing graph-based account detection
research. To address these issues, we propose a Multi-Relational Graph-Based
Twitter Account Detection Benchmark (MGTAB), the first standardized graph-based
benchmark for account detection. To our knowledge, MGTAB was built based on the
largest original data in the field, with over 1.55 million users and 130
million tweets. MGTAB contains 10,199 expert-annotated users and 7 types of
relationships, ensuring high-quality annotation and diversified relations. In
MGTAB, we extracted the 20 user property features with the greatest information
gain and user tweet features as the user features. In addition, we performed a
thorough evaluation of MGTAB and other public datasets. Our experiments found
that graph-based approaches are generally more effective than feature-based
approaches and perform better when introducing multiple relations. By analyzing
experiment results, we identify effective approaches for account detection and
provide potential future research directions in this field. Our benchmark and
standardized evaluation procedures are freely available at:
https://github.com/GraphDetec/MGTAB.
- Abstract(参考訳): ソーシャルメディアのユーザスタンス検出とボット検出手法の開発は、大規模で高品質なベンチマークに大きく依存している。
しかし、アノテーションの品質の低下に加えて、既存のベンチマークは一般的に不完全なユーザ関係を持ち、グラフベースのアカウント検出研究を抑圧している。
これらの問題に対処するため,我々はMGTAB (Multi-Relational Graph-Based Twitter Account Detection Benchmark) を提案する。
我々の知る限り、MGTABはこの分野で最大のオリジナルデータに基づいて構築され、ユーザ数は1億5500万、ツイート数は1億3000万である。
MGTABには10,199名のエキスパートアノテートユーザと7種類の関係があり、高品質なアノテーションと多様な関係を保証する。
MGTABでは,ユーザ機能として最高の情報ゲインとユーザツイート機能を備えた20のユーザプロパティ機能を抽出した。
さらに,MGTABおよび他の公開データセットの徹底的な評価を行った。
実験の結果,グラフベースのアプローチは機能ベースのアプローチよりも一般的に有効であり,複数の関係を導入する際の性能が向上することがわかった。
実験結果を解析することにより,アカウント検出に有効な手法を同定し,今後の研究の方向性を示す。
ベンチマークと標準化された評価手順は、https://github.com/GraphDetec/MGTAB.comで無料で利用可能です。
関連論文リスト
- Towards Realistic Evaluation of Commit Message Generation by Matching Online and Offline Settings [77.20838441870151]
コミットメッセージ生成は、ソフトウェアエンジニアリングにおいて重要なタスクであり、正しく評価することが難しい。
オンラインメトリック - VCSに生成されたメッセージをコミットする前にユーザが導入する編集回数 - を使用して、オフライン実験用のメトリクスを選択します。
その結果,編集距離が最も高い相関を示すのに対し,BLEUやMETEORなどの類似度は低い相関を示すことがわかった。
論文 参考訳(メタデータ) (2024-10-15T20:32:07Z) - M4GT-Bench: Evaluation Benchmark for Black-Box Machine-Generated Text Detection [69.41274756177336]
大規模言語モデル (LLMs) は様々なチャネルにまたがる機械生成テキスト (MGT) を前例のない急激な増加をもたらした。
このことは、その潜在的な誤用と社会的意味に関する正当な懸念を提起する。
本稿では,MGT-M4GT-Benchの多言語,マルチドメイン,マルチジェネレータコーパスに基づく新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2024-02-17T02:50:33Z) - SeGA: Preference-Aware Self-Contrastive Learning with Prompts for
Anomalous User Detection on Twitter [14.483830120541894]
本稿では,ユーザの異常検出のための自己コントラスト学習であるSeGAを提案する。
SeGAは、投稿を通じてユーザの好みを要約するために、大きな言語モデルを使用する。
モデル設計と事前学習戦略の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-12-17T05:35:28Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - Towards Detecting Inauthentic Coordination in Twitter Likes Data [0.0]
ユーザーはカスタムに、品質と権威の中立的なプロキシとして、いいね!などのエンゲージメントのメトリクスを取る。
これは、操作のようなインセンティブを、*コーディネートされた非正当性行動*(CIB)を通じて、世論に影響を与える。
いいね!をターゲットとしたCIBは、ユーザの好みの行動に関する適切なデータを集めることは簡単ではないため、ほとんど研究されていない。
本稿は,Twitterから適切な嗜好データを集めるためのスクリプトアルゴリズムと,デンマークの政治ツイッタースフィア#dkpolからの好意データを集めた30日間のデータセットをコントリビュートする。
論文 参考訳(メタデータ) (2023-05-12T11:24:26Z) - DoubleH: Twitter User Stance Detection via Bipartite Graph Neural
Networks [9.350629400940493]
2020年の米国大統領選挙の大規模なデータセットをクロールし、手動でタグ付けされたハッシュタグによって、すべてのユーザーを自動的にラベル付けします。
本稿では,二部グラフニューラルネットワークモデルであるDoubleHを提案する。
論文 参考訳(メタデータ) (2023-01-20T19:20:10Z) - Self-supervised Graph Representation Learning for Black Market Account
Detection [62.03978210281426]
ブラックマーケットアカウント(BMA)は詐欺に直接関与せず、より検出するのが困難である。
本稿では,10億人以上のユーザを持つ代表的MMMAであるWeChatで使用されているBMA検出システムSGRLについて述べる。
オンライン環境でSGRLをデプロイし、数十億規模のWeChatグラフ上のBMAを検出する。
論文 参考訳(メタデータ) (2022-12-06T00:42:00Z) - Learning Gait Representation from Massive Unlabelled Walking Videos: A
Benchmark [11.948554539954673]
コントラスト学習を伴う歩行認識のための大規模自己教師付きベンチマークを提案する。
1.02万個の歩行シーケンスからなる大規模歩行データセットGaitLU-1Mを収集した。
そこで我々は, CASIA-B, OU-M, GREW, Gait3D の4つの広く使用されている歩行指標を用いて, 事前学習モデルの評価を行った。
論文 参考訳(メタデータ) (2022-06-28T12:33:42Z) - Gait Recognition in the Wild: A Large-scale Benchmark and NAS-based
Baseline [95.88825497452716]
歩行ベンチマークにより、研究コミュニティは高性能歩行認識システムの訓練と評価を行うことができる。
GREWは、野生における歩行認識のための最初の大規模データセットである。
SPOSGaitはNASベースの最初の歩行認識モデルである。
論文 参考訳(メタデータ) (2022-05-05T14:57:39Z) - Detection Recovery in Online Multi-Object Tracking with Sparse Graph
Tracker [17.00871668925939]
既存の共同検出・追跡手法では、従来のトラックレットと現在の検出とを一致させるために、ペアワイズ・リレーショナルな特徴を用いる。
Sparse Graph Tracker (SGT) はより差別的な高次関係特徴を用いた新しいオンライングラフトラッカーである。
MOT16/17/20とHiEve Challengeでは、SGTはリアルタイムの推論速度で最先端のトラッカーを上回っている。
論文 参考訳(メタデータ) (2022-05-02T15:09:36Z) - ConsNet: Learning Consistency Graph for Zero-Shot Human-Object
Interaction Detection [101.56529337489417]
画像中のHuman, Action, Object>の形のHOIインスタンスを検出・認識することを目的としたHuman-Object Interaction (HOI) Detectionの問題点を考察する。
我々は、オブジェクト、アクション、インタラクション間の多レベルコンパレンシーは、稀な、あるいは以前には見られなかったHOIのセマンティック表現を生成するための強力な手がかりであると主張している。
提案モデルでは,人-対象のペアの視覚的特徴とHOIラベルの単語埋め込みを入力とし,それらを視覚-意味的関節埋め込み空間にマッピングし,類似度を計測して検出結果を得る。
論文 参考訳(メタデータ) (2020-08-14T09:11:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。