論文の概要: Binomial Tails for Community Analysis
- arxiv url: http://arxiv.org/abs/2012.09968v1
- Date: Thu, 17 Dec 2020 23:04:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 08:34:14.446921
- Title: Binomial Tails for Community Analysis
- Title(参考訳): コミュニティ分析のための二項尾
- Authors: Omid Madani, Thanh Ngo, Weifei Zeng, Sai Ankith Averine, Sasidhar
Evuru, Varun Malhotra, Shashidhar Gandham, Navindra Yadav
- Abstract要約: 二項モデルを用いて,末尾確率に基づく効率的なグループスコアリング関数を開発した。
合成および多数の実世界のデータに関する実験は、二項スコアリングがより堅牢なランキングにつながるという証拠を提供する。
コミュニティ分析の他の2つの応用として,コミュニティメンバシップの程度(グループスケーリング機能)と,コミュニティ誘導グラフにおける重要なエッジの発見について述べる。
- 参考スコア(独自算出の注目度): 1.1483414615839758
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An important task of community discovery in networks is assessing
significance of the results and robust ranking of the generated candidate
groups. Often in practice, numerous candidate communities are discovered, and
focusing the analyst's time on the most salient and promising findings is
crucial. We develop simple efficient group scoring functions derived from tail
probabilities using binomial models. Experiments on synthetic and numerous
real-world data provides evidence that binomial scoring leads to a more robust
ranking than other inexpensive scoring functions, such as conductance.
Furthermore, we obtain confidence values ($p$-values) that can be used for
filtering and labeling the discovered groups. Our analyses shed light on
various properties of the approach. The binomial tail is simple and versatile,
and we describe two other applications for community analysis: degree of
community membership (which in turn yields group-scoring functions), and the
discovery of significant edges in the community-induced graph.
- Abstract(参考訳): ネットワークにおけるコミュニティ発見の重要な課題は、結果の重要性と、生成した候補グループのロバストなランキングを評価することである。
多くの場合、多くの候補コミュニティが発見され、アナリストの時間を最も有望で有望な発見に集中することが重要です。
二項モデルを用いて,末尾確率から導出した簡便なグループスコアリング関数を開発した。
合成および多数の実世界のデータに関する実験は、二項スコアリングがコンダクタンスのような他の安価なスコアリング関数よりも堅牢なランク付けにつながることを示す。
さらに、検出されたグループをフィルタリングしラベル付けするために使用できる信頼値(p$-values)を得る。
我々の分析はアプローチの様々な特性に光を当てた。
二項尾は単純で汎用的であり、コミュニティ分析の他の2つの応用として、コミュニティメンバーシップの度合い(それがグループスコア機能をもたらす)と、コミュニティが引き起こすグラフにおける重要なエッジの発見について述べる。
関連論文リスト
- A structured regression approach for evaluating model performance across
intersectional subgroups [57.84444882410051]
分散評価は、AIフェアネスアセスメントにおける中心的なタスクであり、異なるサブグループ間でAIシステムのパフォーマンスを測定することを目的としている。
本稿では,システム性能評価の信頼性を実証する,非凝集評価のための構造化回帰手法を提案する。
我々は2つの公開データセットといくつかの半合成データの変種についてアプローチを評価した。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation
using Generative Models [74.43215520371506]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - Heterogeneous Datasets for Federated Survival Analysis Simulation [6.489759672413373]
本研究では、既存の非フェデレーションデータセットから再現可能な方法で開始することで、現実的な異種データセットを構築する新しい手法を提案する。
具体的には、ディリクレ分布に基づく2つの新しいデータセット分割アルゴリズムを提供し、各データサンプルを慎重に選択したクライアントに割り当てる。
提案手法の実装は,フェデレートされた環境をシミュレートしてサバイバル分析を行うことを推奨し,広く普及している。
論文 参考訳(メタデータ) (2023-01-28T11:37:07Z) - Consensus Knowledge Graph Learning via Multi-view Sparse Low Rank Block
Model [12.234494052824921]
ネットワーク分析は、多数のオブジェクト間の関係や相互作用を明らかにする強力なツールである。
しかし、重要なノードとノードの相互作用を正確に識別する効果は、急速に成長するネットワークサイズによって挑戦される。
本稿では、複数のデータソースを組み合わせることで、同時グループ化と接続解析の統一的なフレームワークを開発する。
論文 参考訳(メタデータ) (2022-09-28T01:19:38Z) - Bayesian community detection for networks with covariates [16.230648949593153]
科学界でもっとも注目されているのは「コミュニティ検出」である。
共依存型ランダムパーティションを持つブロックモデルを提案する。
本モデルでは, 後部推測により, コミュニティの数を知ることができる。
論文 参考訳(メタデータ) (2022-03-04T01:58:35Z) - Frequent Itemset-driven Search for Finding Minimum Node Separators in
Complex Networks [61.2383572324176]
本稿では,データマイニングにおける頻繁なアイテムセットマイニングの概念をよく知られたメメティック検索フレームワークに統合する,頻繁なアイテムセット駆動探索手法を提案する。
頻繁なアイテムセット組換え演算子を反復的に使用して、高品質なソリューションで頻繁に発生するアイテムセットに基づいた有望な子孫ソリューションを生成する。
特に、29個の新しい上界を発見し、以前の18個の最もよく知られた境界と一致する。
論文 参考訳(メタデータ) (2022-01-18T11:16:40Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Amortized Probabilistic Detection of Communities in Graphs [49.46170819501234]
そこで我々は,アモータイズされたコミュニティ検出のためのシンプルなフレームワークを提案する。
我々はGNNの表現力と最近のアモータイズクラスタリングの手法を組み合わせる。
我々は、合成および実データセットに関するフレームワークから、いくつかのモデルを評価する。
論文 参考訳(メタデータ) (2020-10-29T16:18:48Z) - Understanding Negative Sampling in Graph Representation Learning [87.35038268508414]
最適化目標と結果のばらつきを決定するためには, 正のサンプリングと同様に負のサンプリングが重要であることを示す。
我々は,自己コントラスト近似による正の分布を近似し,メトロポリス・ハスティングスによる負のサンプリングを高速化するメトロポリス・ハスティングス(MCNS)を提案する。
提案手法は,リンク予測,ノード分類,パーソナライズドレコメンデーションを含む,下流グラフ学習タスクをカバーする5つのデータセットに対して評価する。
論文 参考訳(メタデータ) (2020-05-20T06:25:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。