論文の概要: Zombie Account Detection Based on Community Detection and Uneven
Assignation PageRank
- arxiv url: http://arxiv.org/abs/2101.00922v1
- Date: Mon, 4 Jan 2021 12:33:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 22:51:47.920314
- Title: Zombie Account Detection Based on Community Detection and Uneven
Assignation PageRank
- Title(参考訳): コミュニティ検出と不均一割当てページランクに基づくゾンビアカウント検出
- Authors: Qiu Yaowen, Li Yin, Lu Yanchang
- Abstract要約: ソーシャルメディアでは、多くの潜在的なゾンビアカウントがあり、これは世論に悪影響を及ぼす可能性があります。
伝統的に、PageRankアルゴリズムはゾンビアカウントの検出に使われている。
将来的には、半教師付き学習による分類アルゴリズムを使用してゾンビアカウントを検出することができる。
- 参考スコア(独自算出の注目度): 0.3683202928838613
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the social media, there are a large amount of potential zombie accounts
which may has negative impact on the public opinion. In tradition, PageRank
algorithm is used to detect zombie accounts. However, problems such as it
requires a large RAM to store adjacent matrix or adjacent list and the value of
importance may approximately to zero for large graph exist. To solve the first
problem, since the structure of social media makes the graph divisible, we
conducted a community detection algorithm Louvain to decompose the whole graph
into 1,002 subgraphs. The modularity of 0.58 shows the result is effective. To
solve the second problem, we performed the uneven assignation PageRank
algorithm to calculate the importance of node in each community. Then, a
threshold is set to distinguish the zombie account and normal accounts. The
result shows that about 20% accounts in the dataset are zombie accounts and
they center in tier-one cities in China such as Beijing, Shanghai, and
Guangzhou. In the future, a classification algorithm with semi-supervised
learning can be used to detect zombie accounts.
- Abstract(参考訳): ソーシャルメディアでは、ゾンビの可能性があるアカウントが大量に存在し、それが世論に悪影響を及ぼす可能性がある。
伝統的に、PageRankアルゴリズムはゾンビアカウントの検出に使われている。
しかし、隣接行列や隣接リストを格納するために大きなRAMを必要とするような問題があり、大きなグラフには重要度がほぼゼロになる可能性がある。
最初の問題は、ソーシャルメディアの構造がグラフを分割可能にするため、コミュニティ検出アルゴリズムであるLouvainを用いて、グラフ全体を1,002部分グラフに分解する。
0.58のモジュラリティは、結果が効果的であることを示している。
第2の問題を解決するために,各コミュニティにおけるノードの重要性を計算するために,不均一な割当ページランクアルゴリズムを実施した。
そして、ゾンビアカウントと通常のアカウントを区別するために閾値を設定する。
その結果、データセット内の約20%のアカウントがゾンビアカウントであり、北京、上海、広州など中国のティアワン都市に集中していることがわかった。
将来的には、ゾンビアカウントの検出に半教師付き学習を用いた分類アルゴリズムが用いられるようになる。
関連論文リスト
- Federated Best Arm Identification with Heterogeneous Clients [62.36929749450298]
中央サーバと複数のクライアントを備えた多腕バンディット・セッティングにおける腕の識別について検討した。
予測停止時間上の上限が乗算定数までの下限と一致するアルゴリズム(ほぼ最適アルゴリズムの場合)について示す。
本稿では,指数時間瞬間に通信する新しいアルゴリズムを提案し,ほぼ最適であることを実証する。
論文 参考訳(メタデータ) (2022-10-14T13:09:11Z) - Semi-Parametric Contextual Bandits with Graph-Laplacian Regularization [9.864260997723976]
セミグラフTSはグラフに基づく半パラメトリック報酬モデルのための新しい文脈型トンプソンサンプリングアルゴリズムである。
累積的後悔の上限は、グラフ構造に依存する因子の倍数として表すことができる。
論文 参考訳(メタデータ) (2022-05-17T12:51:54Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Sequential Community Mode Estimation [7.693649834261879]
本研究では,集団内最大の集団を個体の連続的無作為なサンプリングによって同定する問題について検討する。
この問題に対する新しいアルゴリズムを提案し,解析し,任意のアルゴリズムの下でエラーの確率に関する情報理論の下限を確立する。
論文 参考訳(メタデータ) (2021-11-16T15:05:40Z) - Decision-forest voting scheme for classification of rare classes in
network intrusion detection [0.0]
本研究の目的は,オペレーティングマルウェア検出システムの検出能力を向上することである。
このアルゴリズムは、大量のデータを効果的に処理し、意思決定林の訓練に使用される最先端のアルゴリズムのほとんどと併用することができる。
論文 参考訳(メタデータ) (2021-07-25T18:01:12Z) - CrossWalk: Fairness-enhanced Node Representation Learning [39.21278285140597]
グラフアルゴリズムの公平性を向上する,単純で効果的で汎用的な手法であるCrossWalkを開発した。
鍵となる考え方は、グループの境界を越えてランダムウォークをバイアスし、グループの周辺に近く、あるいは(2)ネットワーク内の異なるグループを繋ぐエッジを重み付けすることである。
CrossWalkは、グループの周辺にあるノードを他のグループから隣人に向かって引き出します。
論文 参考訳(メタデータ) (2021-05-06T14:45:34Z) - Consensus Based Multi-Layer Perceptrons for Edge Computing [0.0]
リッチな分散データから学ぶためには、新しいアルゴリズムが必要である。
資源制約デバイスに対するコンセンサスに基づく多層パーセプトロンを提案する。
論文 参考訳(メタデータ) (2021-02-09T18:39:46Z) - Distribution Matching for Crowd Counting [51.90971145453012]
アノテーションにガウスを付与することは一般化性能を損なうことを示す。
我々は,群集CoUNTing (DM-Count) における分布マッチングの利用を提案する。
平均絶対誤差(Mean Absolute Error)の観点では、DM-Countは従来の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-09-28T04:57:23Z) - Grale: Designing Networks for Graph Learning [68.23038997141381]
我々は,数十億のノードを持つグラフのグラフ設計問題に対処するために,スケーラブルなGraleを提案する。
グレールは、(潜在的に弱い)類似性の異なる測度を融合して、そのノード間の高いタスク固有のホモフィリーを示すグラフを作成する。
Googleでは、数千億のノードを持つデータセットや、数十兆の潜在的なエッジを含む、20以上の異なる産業環境にGraleをデプロイしています。
論文 参考訳(メタデータ) (2020-07-23T13:25:36Z) - CNN-based Density Estimation and Crowd Counting: A Survey [65.06491415951193]
本稿では,主にCNNに基づく密度マップ推定法において,群集数モデルについて包括的に検討する。
評価指標から, 観客数データセットで上位3人のパフォーマーを選択した。
我々は、今後のクラウドカウントの展開について、合理的な推測と予測を行うことを期待する。
論文 参考訳(メタデータ) (2020-03-28T13:17:30Z) - Quantized Decentralized Stochastic Learning over Directed Graphs [52.94011236627326]
有向グラフ上で通信する計算ノード間でデータポイントが分散される分散学習問題を考える。
モデルのサイズが大きくなるにつれて、分散学習は、各ノードが隣人にメッセージ(モデル更新)を送信することによる通信負荷の大きなボトルネックに直面します。
本稿では,分散コンセンサス最適化におけるプッシュサムアルゴリズムに基づく有向グラフ上の量子化分散学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-23T18:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。