論文の概要: Detection of Fake Users in SMPs Using NLP and Graph Embeddings
- arxiv url: http://arxiv.org/abs/2104.13094v1
- Date: Tue, 27 Apr 2021 10:30:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-28 19:29:47.760817
- Title: Detection of Fake Users in SMPs Using NLP and Graph Embeddings
- Title(参考訳): NLPおよびグラフ埋め込みを用いたSMPにおけるフェイクユーザ検出
- Authors: Manojit Chakraborty, Shubham Das, Radhika Mamidi
- Abstract要約: facebook、twitter、instagramなどのソーシャルメディアプラットフォーム(smp)。
世界中に巨大なユーザベースがあり、毎秒大量のデータを生成しています。
この中には、フェイクやスパムのユーザーによる投稿が多数含まれており、通常は世界中の多くの組織が他と競合するために使っている。
グラフ表現学習と自然言語処理を組み合わせた手法を用いて,Twitter上でのGenuineアカウントとSpamアカウントの区別方法を示す。
- 参考スコア(独自算出の注目度): 7.817598216459955
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Social Media Platforms (SMPs) like Facebook, Twitter, Instagram etc. have
large user base all around the world that generates huge amount of data every
second. This includes a lot of posts by fake and spam users, typically used by
many organisations around the globe to have competitive edge over others. In
this work, we aim at detecting such user accounts in Twitter using a novel
approach. We show how to distinguish between Genuine and Spam accounts in
Twitter using a combination of Graph Representation Learning and Natural
Language Processing techniques.
- Abstract(参考訳): facebook、twitter、instagramなどのソーシャルメディアプラットフォーム(smp)。
世界中に巨大なユーザベースがあり、毎秒大量のデータを生成しています。
これには、フェイクやスパムのユーザーによる投稿が多数含まれており、通常は世界中の多くの組織が他と競合するために使っている。
本研究では,このようなユーザアカウントをTwitter上で検出する手法を提案する。
グラフ表現学習と自然言語処理を組み合わせた手法を用いて,Twitter上でのGenuineアカウントとSpamアカウントの区別方法を示す。
関連論文リスト
- Learning Social Graph for Inactive User Recommendation [50.090904659803854]
LSIRはソーシャルレコメンデーションのための最適なソーシャルグラフ構造を学習する。
実世界のデータセットの実験では、LSIRはNDCGで最大129.58%の大幅な改善を実現している。
論文 参考訳(メタデータ) (2024-05-08T03:40:36Z) - WildChat: 1M ChatGPT Interaction Logs in the Wild [88.05964311416717]
WildChatは100万件のユーザー・チャットGPT会話のコーパスで、250万回以上のインタラクション・ターンで構成されている。
タイムスタンプによるチャットの書き起こしに加えて、州、国、ハッシュIPアドレスを含む人口統計データでデータセットを豊かにします。
論文 参考訳(メタデータ) (2024-05-02T17:00:02Z) - DoubleH: Twitter User Stance Detection via Bipartite Graph Neural
Networks [9.350629400940493]
2020年の米国大統領選挙の大規模なデータセットをクロールし、手動でタグ付けされたハッシュタグによって、すべてのユーザーを自動的にラベル付けします。
本稿では,二部グラフニューラルネットワークモデルであるDoubleHを提案する。
論文 参考訳(メタデータ) (2023-01-20T19:20:10Z) - ViralBERT: A User Focused BERT-Based Approach to Virality Prediction [11.992815669875924]
本稿では、コンテンツとユーザベースの機能を用いて、ツイートのバイラル性を予測できるViralBERTを提案する。
ハッシュタグやフォロワー数などの数値的特徴を合成してテキストをツイートし、2つのBERTモジュールを利用する手法を用いる。
ViralBERTをトレーニングするために330kのツイートのデータセットを収集し、この分野での現在の研究からベースラインを使用して、モデルの有効性を検証する。
論文 参考訳(メタデータ) (2022-05-17T21:40:24Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - User-Level Private Learning via Correlated Sampling [49.453751858361265]
我々は、各ユーザが$m$のサンプルを持ち、プライバシ保護が各ユーザのデータレベルで実施される設定について検討する。
この設定では、より少ない数のユーザーで学習できることが示されます。
論文 参考訳(メタデータ) (2021-10-21T15:33:53Z) - Twitter User Representation using Weakly Supervised Graph Embedding [29.89122455417348]
ユーザタイプを理解するための弱い教師付きグラフ埋め込みベースのフレームワークを提案する。
我々は,Twitterのツイートに対する弱い監督力を用いて学習したユーザ埋め込みを評価した。
実世界のデータセットの実験では、提案されたフレームワークがユーザタイプを検出するベースラインを上回っていることが示されている。
論文 参考訳(メタデータ) (2021-08-20T03:54:29Z) - Towards A Sentiment Analyzer for Low-Resource Languages [0.0]
本研究は,当時盛んに議論されてきた特定のトレンドトピックに対して,ユーザの感情を分析することを目的としている。
2019年のインドネシア大統領選挙で話題になったハッシュタグのtextit#kpujangancurangを使っています。
本研究は,ラピッドマイニングツールを用いて,Twitterデータを生成し,Nieve Bayes,K-Nearest Neighbor,Decision Tree,Multi-Layer Perceptronの分類手法を比較し,Twitterデータの感情を分類する。
論文 参考訳(メタデータ) (2020-11-12T13:50:00Z) - Partial Bandit and Semi-Bandit: Making the Most Out of Scarce Users'
Feedback [62.997667081978825]
本稿では,ユーザのフィードバックを考慮し,3つの戦略を用いて評価する手法を提案する。
ユーザからのフィードバックが制限されているにも関わらず(全体の20%以下)、我々の手法は最先端のアプローチと同じような結果が得られる。
論文 参考訳(メタデータ) (2020-09-16T07:32:51Z) - Sentiment Analysis on Social Media Content [0.0]
本研究の目的は,Twitterから収集した実データの感情分析を行うモデルを提案することである。
Twitterのデータは非常に非構造化されており、分析が困難である。
提案手法は,教師付き機械学習アルゴリズムと教師なし機械学習アルゴリズムの併用により,この分野の先行研究とは異なる。
論文 参考訳(メタデータ) (2020-07-04T17:03:30Z) - Forensic Authorship Analysis of Microblogging Texts Using N-Grams and
Stylometric Features [63.48764893706088]
この研究は、280文字に制限されたツイートメッセージの作者を特定することを目的としている。
弊社の実験では、40名のユーザによる、ユーザ毎120から200のつぶやきを自己キャプチャしたデータベースを使っています。
この小さなセットを使った結果は有望であり、異なる特徴は92%から98.5%の分類精度を提供する。
論文 参考訳(メタデータ) (2020-03-24T19:32:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。