論文の概要: Implicit models, latent compression, intrinsic biases, and cheap lunches
in community detection
- arxiv url: http://arxiv.org/abs/2210.09186v3
- Date: Wed, 19 Oct 2022 07:14:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 14:03:20.920830
- Title: Implicit models, latent compression, intrinsic biases, and cheap lunches
in community detection
- Title(参考訳): コミュニティ検出におけるインプシットモデル,潜伏圧縮,内在バイアス,安価なランチ
- Authors: Tiago P. Peixoto, Alec Kirkley
- Abstract要約: コミュニティ検出は、ネットワークをノードのクラスタに分割して、その大規模な構造を要約することを目的としている。
いくつかのコミュニティ検出手法は、確率的生成モデルを通じてクラスタリングの目的を明示的に導出する。
他の方法は記述的であり、特定のアプリケーションによって動機付けられた目的に応じてネットワークを分割する。
本稿では,コミュニティ検出対象,推論対象,記述対象とそれに対応する暗黙的ネットワーク生成モデルとを関連付けるソリューションを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The task of community detection, which aims to partition a network into
clusters of nodes to summarize its large-scale structure, has spawned the
development of many competing algorithms with varying objectives. Some
community detection methods are inferential, explicitly deriving the clustering
objective through a probabilistic generative model, while other methods are
descriptive, dividing a network according to an objective motivated by a
particular application, making it challenging to compare these methods on the
same scale. Here we present a solution to this problem that associates any
community detection objective, inferential or descriptive, with its
corresponding implicit network generative model. This allows us to compute the
description length of a network and its partition under arbitrary objectives,
providing a principled measure to compare the performance of different
algorithms without the need for "ground truth" labels. Our approach also gives
access to instances of the community detection problem that are optimal to any
given algorithm, and in this way reveals intrinsic biases in popular
descriptive methods, explaining their tendency to overfit. Using our framework,
we compare a number of community detection methods on artificial networks, and
on a corpus of over 500 structurally diverse empirical networks. We find that
more expressive community detection methods exhibit consistently superior
compression performance on structured data instances, without having degraded
performance on a minority of situations where more specialized algorithms
perform optimally. Our results undermine the implications of the "no free
lunch" theorem for community detection, both conceptually and in practice,
since it is confined to unstructured data instances, unlike relevant community
detection problems which are structured by requirement.
- Abstract(参考訳): ネットワークをノードのクラスタに分割して大規模構造を要約することを目的としたコミュニティ検出のタスクは、さまざまな目的を持った多くの競合するアルゴリズムの開発を生み出した。
いくつかのコミュニティ検出手法は予測的であり、確率的生成モデルを通じてクラスタリングの目的を明示的に導出するが、他の手法は記述的であり、特定のアプリケーションによって動機づけられた目的に従ってネットワークを分割する。
本稿では,コミュニティ検出対象,推論対象,記述対象と,それに対応する暗黙的ネットワーク生成モデルとを関連付ける。
これにより、任意の目的の下でネットワークとその分割の記述長を計算し、異なるアルゴリズムのパフォーマンスを「基底真理」ラベルなしで比較するための原則的尺度を提供する。
提案手法は,任意のアルゴリズムに最適なコミュニティ検出問題の事例にもアクセス可能であり,この方法では,一般的な記述手法における固有のバイアスを明らかにし,過度に適合する傾向を説明する。
本フレームワークを用いて,500以上の構造的多様な経験的ネットワークのコーパスと,人工ネットワーク上でのコミュニティ検出手法を比較した。
より表現力のあるコミュニティ検出手法は、より特殊なアルゴリズムが最適に動作する少数の状況において、性能を低下させることなく、構造化データインスタンス上で一貫して優れた圧縮性能を示す。
本研究の結果は,非構造化データインスタンスに限定されているため,概念的にも現実的にも,コミュニティ検出における「無料ランチ」定理の意義を損なうものである。
関連論文リスト
- Enhancing Community Detection in Networks: A Comparative Analysis of Local Metrics and Hierarchical Algorithms [49.1574468325115]
本研究は,地域間類似度指標を用いた地域検出の関連性を評価するために,同じ手法を用いている。
これらの指標の有効性は,異なるコミュニティサイズを持つ複数の実ネットワークにベースアルゴリズムを適用して評価した。
論文 参考訳(メタデータ) (2024-08-17T02:17:09Z) - Sifting out communities in large sparse networks [2.666294200266662]
大規模ネットワークにおけるクラスタリングの結果の質を定量化するための直感的な客観的関数を導入する。
この領域に特に適したコミュニティを特定するために,2段階の手法を用いる。
数万のノードからなる大規模ネットワークにおける複雑な遺伝的相互作用を同定する。
論文 参考訳(メタデータ) (2024-05-01T18:57:41Z) - Semi-supervised Community Detection via Structural Similarity Metrics [0.0]
本研究では,新しいノードのコミュニティラベルを推定することを目的とした,半教師付きコミュニティ検出問題について検討する。
本稿では,新しいノードとK$コミュニティ間の構造的類似度メトリック'を計算するアルゴリズムを提案する。
我々の知る限りでは、理論的な保証を提供する最初の半教師付きコミュニティ検出アルゴリズムである。
論文 参考訳(メタデータ) (2023-06-01T19:02:50Z) - Bayesian community detection for networks with covariates [16.230648949593153]
科学界でもっとも注目されているのは「コミュニティ検出」である。
共依存型ランダムパーティションを持つブロックモデルを提案する。
本モデルでは, 後部推測により, コミュニティの数を知ることができる。
論文 参考訳(メタデータ) (2022-03-04T01:58:35Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Learning to Detect Critical Nodes in Sparse Graphs via Feature Importance Awareness [53.351863569314794]
クリティカルノード問題(CNP)は、削除が残余ネットワークのペア接続性を最大に低下させるネットワークから臨界ノードの集合を見つけることを目的としている。
本研究は,ノード表現のための特徴重要度対応グラフアテンションネットワークを提案する。
ダブルディープQネットワークと組み合わせて、初めてCNPを解くエンドツーエンドのアルゴリズムを作成する。
論文 参考訳(メタデータ) (2021-12-03T14:23:05Z) - Descriptive vs. inferential community detection in networks: pitfalls,
myths, and half-truths [0.0]
推論手法は、より明確な科学的問題と整合し、より堅牢な結果をもたらすのが一般的であり、多くの場合好まれるべきである、と我々は主張する。
我々は,コミュニティ検出が実際に行われている場合によく信じられる神話や半真実を,そのような手法の使用と結果の解釈の両方を改善するために,取り除こうと試みている。
論文 参考訳(メタデータ) (2021-11-30T23:57:51Z) - Unsupervised Domain-adaptive Hash for Networks [81.49184987430333]
ドメイン適応型ハッシュ学習はコンピュータビジョンコミュニティでかなりの成功を収めた。
UDAHと呼ばれるネットワークのための教師なしドメイン適応型ハッシュ学習手法を開発した。
論文 参考訳(メタデータ) (2021-08-20T12:09:38Z) - Anomaly Detection on Attributed Networks via Contrastive Self-Supervised
Learning [50.24174211654775]
本論文では,アトリビュートネットワーク上の異常検出のためのコントラスト型自己監視学習フレームワークを提案する。
このフレームワークは、新しいタイプのコントラストインスタンスペアをサンプリングすることで、ネットワークデータからのローカル情報を完全に活用します。
高次元特性と局所構造から情報埋め込みを学習するグラフニューラルネットワークに基づくコントラスト学習モデルを提案する。
論文 参考訳(メタデータ) (2021-02-27T03:17:20Z) - On the use of local structural properties for improving the efficiency
of hierarchical community detection methods [77.34726150561087]
本研究では,階層型コミュニティ検出の効率向上のために,局所構造ネットワーク特性をプロキシとして利用する方法について検討する。
また,ネットワークプルーニングの性能への影響を,階層的コミュニティ検出をより効率的にするための補助的手法として検証する。
論文 参考訳(メタデータ) (2020-09-15T00:16:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。