論文の概要: Quasi-Clique Discovery via Energy Diffusion
- arxiv url: http://arxiv.org/abs/2508.04174v2
- Date: Wed, 08 Oct 2025 15:12:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 14:21:18.0845
- Title: Quasi-Clique Discovery via Energy Diffusion
- Title(参考訳): エネルギー拡散による準斜めの発見
- Authors: Yu Zhang, Yilong Luo, Mingyuan Ma, Yao Chen, Enqiang Zhu, Jin Xu, Chanjuan Liu,
- Abstract要約: 本稿では,準斜め発見のためのエネルギー拡散に基づくEDQCを提案する。
75個の実世界のグラフでの実験では、EDQCはほとんどのデータセット上でより大きな準斜めを見つける。
- 参考スコア(独自算出の注目度): 10.89783689583763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Discovering quasi-cliques -- subgraphs whose edge density exceeds a given threshold -- is a fundamental task in graph mining with applications to web spam detection, fraud screening, and e-commerce recommendation. However, existing methods for quasi-clique discovery on large-scale web graphs are often sensitive to random seeds or lack of explicit edge-density guarantees, making the task challenging in practice. This paper presents EDQC, an energy diffusion-based method for quasi-clique discovery. EDQC first employs an adaptive energy diffusion process to generate an energy ranking that highlights structurally cohesive regions. Guided by this energy ranking, the algorithm identifies a high-quality subgraph by minimizing conductance, a standard measure from community detection. This subgraph is then refined to meet the specified density threshold. Extensive experiments on 75 real-world graphs show that EDQC finds larger quasi-cliques on most datasets, with consistently lower variance across runs and competitive runtime. To the best of our knowledge, EDQC is the first method to incorporate energy diffusion into quasi-clique discovery.
- Abstract(参考訳): エッジ密度が所定の閾値を超えた部分グラフである準斜めの発見は、Webスパムの検出、不正なスクリーニング、eコマース推奨など、グラフマイニングの基本的な課題である。
しかし、大規模なウェブグラフ上の準斜めの発見法は、しばしばランダムなシードや明示的なエッジ密度保証の欠如に敏感であり、実際は課題となっている。
本稿では,準斜め発見のためのエネルギー拡散に基づくEDQCを提案する。
EDQCは、まず適応的なエネルギー拡散プロセスを用いて、構造的な凝集領域を強調するエネルギーランキングを生成する。
このエネルギーランキングによって導かれるアルゴリズムは,コミュニティ検出の標準指標であるコンダクタンスを最小化することにより,高品質なサブグラフを識別する。
この部分グラフは、指定された密度閾値を満たすように精製される。
75個の実世界のグラフに対する大規模な実験により、EDQCは、ほとんどのデータセットにおいて、実行時間と競合するランタイム間のばらつきが一貫して低いような、より大きな準傾きを見出すことが示された。
我々の知る限りでは、EDQCは準斜め発見にエネルギー拡散を組み込む最初の方法である。
関連論文リスト
- Adjoint Sampling: Highly Scalable Diffusion Samplers via Adjoint Matching [33.9461078261722]
非正規化密度からの拡散過程を学習するための,高度にスケーラブルで効率的なアルゴリズムであるAdjoint Samplingを導入する。
カルテジアンおよびねじり座標の両方の分子をモデル化するために、鍵対称性と周期境界条件を組み込む方法を示す。
本稿では,古典的エネルギー関数の広範な実験を通じて提案手法の有効性を実証し,さらにニューラルネットワークに基づくエネルギーモデルまで拡張する。
論文 参考訳(メタデータ) (2025-04-16T02:20:06Z) - Decoupled Graph Energy-based Model for Node Out-of-Distribution Detection on Heterophilic Graphs [61.226857589092]
グラフ学習におけるノードのOOD検出は未探索のままである。
GNNSafeは、最先端の性能を持つグラフ領域にエネルギーベースの検出を適用した。
本稿では,学習過程をノード表現のためのトポロジ情報を利用するグラフエンコーダと,遅延空間で動作するエネルギーヘッドの2つの部分に分解するDeGEMを紹介する。
論文 参考訳(メタデータ) (2025-02-25T07:20:00Z) - GeoMix: Towards Geometry-Aware Data Augmentation [76.09914619612812]
Mixupは画像分類におけるラベル付き限られたデータによる課題の緩和にかなりの成功を収めている。
In-place graph editing を利用した簡易かつ解釈可能な混合手法 Geometric Mixup (GeoMix) を提案する。
論文 参考訳(メタデータ) (2024-07-15T12:58:04Z) - Energy-based Epistemic Uncertainty for Graph Neural Networks [47.52218144839666]
高品質な不確実性推定を提供するエネルギーベースモデル(EBM)を提案する。
我々は、エネルギー関数を正則化することにより、データ空間の可積分密度を確実に誘導する。
我々のフレームワークは、様々な分散シフトに敏感な事前学習GNNに適用可能な、シンプルで効果的なポストホック手法である。
論文 参考訳(メタデータ) (2024-06-06T13:13:29Z) - LightDiC: A Simple yet Effective Approach for Large-scale Digraph
Representation Learning [42.72417353512392]
磁気ラプラシアンに基づくダイグラフ畳み込みのスケーラブルな変種であるLightDiCを提案する。
LightDiCは、最も代表的な大規模データベースで満足な結果を提供する最初のDiGNNである。
論文 参考訳(メタデータ) (2024-01-22T09:09:10Z) - Joint Learning of Label and Environment Causal Independence for Graph
Out-of-Distribution Generalization [60.4169201192582]
本稿では,ラベルと環境情報を完全に活用するために,ラベルと環境の因果独立(LECI)を導入することを提案する。
LECIは、合成データセットと実世界のデータセットの両方において、従来の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2023-06-01T19:33:30Z) - GFlowCausal: Generative Flow Networks for Causal Discovery [27.51595081346858]
本稿では,GFlowCausalと呼ばれる観測データからDAG(Directed Acyclic Graph)を学習するための新しい手法を提案する。
GFlowCausalは、事前定義された報酬に比例した確率を持つシーケンシャルアクションによって、ハイリワードDAGを生成するための最良のポリシーを学ぶことを目的としている。
合成データセットと実データセットの両方について広範な実験を行い、提案手法が優れていることを示すとともに、大規模環境での良好な性能を示す。
論文 参考訳(メタデータ) (2022-10-15T04:07:39Z) - Handling Distribution Shifts on Graphs: An Invariance Perspective [78.31180235269035]
我々は、グラフ上のOOD問題を定式化し、新しい不変学習手法である探索・拡張リスク最小化(EERM)を開発する。
EERMは、複数の仮想環境からのリスクの分散を最大化するために、敵対的に訓練された複数のコンテキストエクスプローラーを利用する。
理論的に有効なOOD解の保証を示すことによって,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-02-05T02:31:01Z) - Block-Approximated Exponential Random Graphs [77.4792558024487]
指数乱グラフ(ERG)の分野における重要な課題は、大きなグラフ上の非自明なERGの適合である。
本稿では,非自明なERGに対する近似フレームワークを提案する。
我々の手法は、数百万のノードからなるスパースグラフにスケーラブルである。
論文 参考訳(メタデータ) (2020-02-14T11:42:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。