論文の概要: Binomial Tails for Community Analysis
- arxiv url: http://arxiv.org/abs/2012.09968v1
- Date: Thu, 17 Dec 2020 23:04:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 08:34:14.446921
- Title: Binomial Tails for Community Analysis
- Title(参考訳): コミュニティ分析のための二項尾
- Authors: Omid Madani, Thanh Ngo, Weifei Zeng, Sai Ankith Averine, Sasidhar
Evuru, Varun Malhotra, Shashidhar Gandham, Navindra Yadav
- Abstract要約: 二項モデルを用いて,末尾確率に基づく効率的なグループスコアリング関数を開発した。
合成および多数の実世界のデータに関する実験は、二項スコアリングがより堅牢なランキングにつながるという証拠を提供する。
コミュニティ分析の他の2つの応用として,コミュニティメンバシップの程度(グループスケーリング機能)と,コミュニティ誘導グラフにおける重要なエッジの発見について述べる。
- 参考スコア(独自算出の注目度): 1.1483414615839758
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An important task of community discovery in networks is assessing
significance of the results and robust ranking of the generated candidate
groups. Often in practice, numerous candidate communities are discovered, and
focusing the analyst's time on the most salient and promising findings is
crucial. We develop simple efficient group scoring functions derived from tail
probabilities using binomial models. Experiments on synthetic and numerous
real-world data provides evidence that binomial scoring leads to a more robust
ranking than other inexpensive scoring functions, such as conductance.
Furthermore, we obtain confidence values ($p$-values) that can be used for
filtering and labeling the discovered groups. Our analyses shed light on
various properties of the approach. The binomial tail is simple and versatile,
and we describe two other applications for community analysis: degree of
community membership (which in turn yields group-scoring functions), and the
discovery of significant edges in the community-induced graph.
- Abstract(参考訳): ネットワークにおけるコミュニティ発見の重要な課題は、結果の重要性と、生成した候補グループのロバストなランキングを評価することである。
多くの場合、多くの候補コミュニティが発見され、アナリストの時間を最も有望で有望な発見に集中することが重要です。
二項モデルを用いて,末尾確率から導出した簡便なグループスコアリング関数を開発した。
合成および多数の実世界のデータに関する実験は、二項スコアリングがコンダクタンスのような他の安価なスコアリング関数よりも堅牢なランク付けにつながることを示す。
さらに、検出されたグループをフィルタリングしラベル付けするために使用できる信頼値(p$-values)を得る。
我々の分析はアプローチの様々な特性に光を当てた。
二項尾は単純で汎用的であり、コミュニティ分析の他の2つの応用として、コミュニティメンバーシップの度合い(それがグループスコア機能をもたらす)と、コミュニティが引き起こすグラフにおける重要なエッジの発見について述べる。
関連論文リスト
- Combine and Conquer: A Meta-Analysis on Data Shift and Out-of-Distribution Detection [30.377446496559635]
本稿では,アウト・オブ・ディストリビューション(OOD)検出スコアをシームレスに組み合わせるための普遍的アプローチを提案する。
我々のフレームワークは、検出スコアにおける将来の発展にとって容易であり、この文脈で意思決定境界を結合する最初の手段である。
論文 参考訳(メタデータ) (2024-06-23T08:16:44Z) - Bayesian Joint Additive Factor Models for Multiview Learning [7.254731344123118]
マルチオミクスデータが収集され、臨床結果と相関する精度医学の文脈でモチベーション応用が生じる。
本稿では,共有およびビュー固有のコンポーネントを考慮に入れた,構造化された付加的設計を伴うJAFAR(Joint Additive Factor regression model)を提案する。
免疫,メタボローム,プロテオームデータから得られた時間とラベルの発症の予測は,最先端の競合相手に対するパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2024-06-02T15:35:45Z) - Sifting out communities in large sparse networks [2.666294200266662]
大規模ネットワークにおけるクラスタリングの結果の質を定量化するための直感的な客観的関数を導入する。
この領域に特に適したコミュニティを特定するために,2段階の手法を用いる。
数万のノードからなる大規模ネットワークにおける複雑な遺伝的相互作用を同定する。
論文 参考訳(メタデータ) (2024-05-01T18:57:41Z) - A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Bayesian community detection for networks with covariates [16.230648949593153]
科学界でもっとも注目されているのは「コミュニティ検出」である。
共依存型ランダムパーティションを持つブロックモデルを提案する。
本モデルでは, 後部推測により, コミュニティの数を知ることができる。
論文 参考訳(メタデータ) (2022-03-04T01:58:35Z) - Frequent Itemset-driven Search for Finding Minimum Node Separators in
Complex Networks [61.2383572324176]
本稿では,データマイニングにおける頻繁なアイテムセットマイニングの概念をよく知られたメメティック検索フレームワークに統合する,頻繁なアイテムセット駆動探索手法を提案する。
頻繁なアイテムセット組換え演算子を反復的に使用して、高品質なソリューションで頻繁に発生するアイテムセットに基づいた有望な子孫ソリューションを生成する。
特に、29個の新しい上界を発見し、以前の18個の最もよく知られた境界と一致する。
論文 参考訳(メタデータ) (2022-01-18T11:16:40Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Understanding Negative Sampling in Graph Representation Learning [87.35038268508414]
最適化目標と結果のばらつきを決定するためには, 正のサンプリングと同様に負のサンプリングが重要であることを示す。
我々は,自己コントラスト近似による正の分布を近似し,メトロポリス・ハスティングスによる負のサンプリングを高速化するメトロポリス・ハスティングス(MCNS)を提案する。
提案手法は,リンク予測,ノード分類,パーソナライズドレコメンデーションを含む,下流グラフ学習タスクをカバーする5つのデータセットに対して評価する。
論文 参考訳(メタデータ) (2020-05-20T06:25:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。