論文の概要: Beyond the Academic Monoculture: A Unified Framework and Industrial Perspective for Attributed Graph Clustering
- arxiv url: http://arxiv.org/abs/2603.20829v1
- Date: Sat, 21 Mar 2026 14:15:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.108106
- Title: Beyond the Academic Monoculture: A Unified Framework and Industrial Perspective for Attributed Graph Clustering
- Title(参考訳): 学術的モノカルチャーを超えて - 分散グラフクラスタリングのための統一フレームワークと産業的展望
- Authors: Yunhui Liu, Yue Liu, Yongchao Liu, Tao Zheng, Stan Z. Li, Xinwang Liu, Tieke He,
- Abstract要約: 分散グラフクラスタリング(AGC)は、構造トポロジとノード属性を共同でモデル化することによって、ノードを凝集性グループに分割する基本的な教師なしタスクである。
この調査は、3つの相補的な視点からAGCを包括的かつ工業的に基礎づけたレビューを提供する。
- 参考スコア(独自算出の注目度): 75.50670592447219
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Attributed Graph Clustering (AGC) is a fundamental unsupervised task that partitions nodes into cohesive groups by jointly modeling structural topology and node attributes. While the advent of graph neural networks and self-supervised learning has catalyzed a proliferation of AGC methodologies, a widening chasm persists between academic benchmark performance and the stringent demands of real-world industrial deployment. To bridge this gap, this survey provides a comprehensive, industrially grounded review of AGC from three complementary perspectives. First, we introduce the Encode-Cluster-Optimize taxonomic framework, which decomposes the diverse algorithmic landscape into three orthogonal, composable modules: representation encoding, cluster projection, and optimization strategy. This unified paradigm enables principled architectural comparisons and inspires novel methodological combinations. Second, we critically examine prevailing evaluation protocols to expose the field's academic monoculture: a pervasive over-reliance on small, homophilous citation networks, the inadequacy of supervised-only metrics for an inherently unsupervised task, and the chronic neglect of computational scalability. In response, we advocate for a holistic evaluation standard that integrates supervised semantic alignment, unsupervised structural integrity, and rigorous efficiency profiling. Third, we explicitly confront the practical realities of industrial deployment. By analyzing operational constraints such as massive scale, severe heterophily, and tabular feature noise alongside extensive empirical evidence from our companion benchmark, we outline actionable engineering strategies. Furthermore, we chart a clear roadmap for future research, prioritizing heterophily-robust encoders, scalable joint optimization, and unsupervised model selection criteria to meet production-grade requirements.
- Abstract(参考訳): 分散グラフクラスタリング(AGC)は、構造トポロジとノード属性を共同でモデル化することによって、ノードを凝集性グループに分割する基本的な教師なしタスクである。
グラフニューラルネットワークと自己教師型学習の出現は、AGC方法論の増殖を触媒する一方で、学術ベンチマークのパフォーマンスと、実世界の産業展開の厳しい要求との間には、大きな亀裂が続いている。
このギャップを埋めるために、この調査は3つの相補的な視点からAGCを包括的で工業的に基礎づけたレビューを提供する。
まず,Encode-Cluster-Optimize分類体系を導入し,アルゴリズムの多様な景観を3つの直交構成可能なモジュールに分解する。
この統一されたパラダイムは、原則的なアーキテクチャ比較を可能にし、新しい方法論の組み合わせを刺激する。
第2に、フィールドの学術的モノカルチャーを明らかにするための一般的な評価プロトコルについて、小規模でホモフィルな引用ネットワークへの過度な依存、教師のみのみのメトリクスが本質的に教師なしのタスクに不適切であること、計算スケーラビリティの慢性的な無視について、批判的に検討する。
これに対し,教師付きセマンティックアライメント,教師なし構造整合性,厳密な効率プロファイルを統合した包括的評価標準を提案する。
第3に、産業展開の現実性に明示的に向き合っています。
大規模,重度ヘテロフィリー,表型特徴雑音などの運用上の制約を,我々のベンチマークによる広範な実証的証拠とともに分析することにより,実行可能なエンジニアリング戦略を概説する。
さらに,不均質なエンコーダの優先順位付け,拡張性のある共同最適化,生産レベルの要求を満たすための教師なしモデル選択基準など,今後の研究の明確なロードマップを示す。
関連論文リスト
- Bridging Academia and Industry: A Comprehensive Benchmark for Attributed Graph Clustering [19.247242477915382]
分散グラフクラスタリング(AGC)は、構造トポロジとノード属性を統合して、グラフ構造化データの潜在パターンを明らかにする、基本的な教師なしタスクである。
不正検出やユーザセグメンテーションといった産業的応用において重要であるが、学術研究と現実世界の展開の間には大きな亀裂が残っている。
PyAGCは多種多様なスケールと構造特性にまたがってAGC手法をストレステストするために設計された,実運用可能なベンチマークおよびライブラリである。
論文 参考訳(メタデータ) (2026-02-09T11:07:24Z) - Beyond Binary Classification: A Semi-supervised Approach to Generalized AI-generated Image Detection [1.189955933770711]
現在の法医学における重大な脆弱性は、検出器がクロスジェネレータの一般化を達成できないことである。
本稿では,「フェイク」クラス内の潜在アーキテクチャパターンを発見することによって,バイナリ分類を強化する半教師付きアプローチを提案する。
論文 参考訳(メタデータ) (2025-11-23T16:02:27Z) - OntoAligner Meets Knowledge Graph Embedding Aligners [5.014358661236625]
この研究は、スケーラブルで構造を意識した表現を提供する知識グラフ埋め込み(KGE)モデルの未発見の可能性を再考する。
我々は17種類のKGEモデルをサポートするOntoAlignerライブラリに統合されたモジュラーフレームワークを開発した。
5つのドメインにまたがる7つのベンチマークデータセットにまたがる標準メトリクスを使用して、我々のアプローチを評価する。
論文 参考訳(メタデータ) (2025-09-30T15:41:23Z) - Graph Structure Refinement with Energy-based Contrastive Learning [56.957793274727514]
グラフの構造と表現を学習するための生成訓練と識別訓練のジョイントに基づく教師なし手法を提案する。
本稿では,ECL-GSR(Energy-based Contrastive Learning)によるグラフ構造再構成(GSR)フレームワークを提案する。
ECL-GSRは、主要なベースラインに対するサンプルやメモリの少ない高速なトレーニングを実現し、下流タスクの単純さと効率性を強調している。
論文 参考訳(メタデータ) (2024-12-20T04:05:09Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - Unifying Self-Supervised Clustering and Energy-Based Models [9.3176264568834]
自己教師付き学習と生成モデルとの間には,原則的な関連性を確立する。
シンボル接地問題の単純かつ非自明なインスタンス化に対処するために,我々の解法をニューロシンボリックな枠組みに統合できることが示される。
論文 参考訳(メタデータ) (2023-12-30T04:46:16Z) - Efficient Multi-View Graph Clustering with Local and Global Structure
Preservation [59.49018175496533]
局所・グローバル構造保存を用いた効率的なマルチビューグラフクラスタリング(EMVGC-LG)という,アンカーベースのマルチビューグラフクラスタリングフレームワークを提案する。
具体的には、EMVGC-LGがクラスタリング品質を向上させるために、アンカー構築とグラフ学習を共同で最適化する。
さらに、EMVGC-LGはサンプル数に関する既存のAMVGCメソッドの線形複雑性を継承する。
論文 参考訳(メタデータ) (2023-08-31T12:12:30Z) - Embedding Graph Auto-Encoder for Graph Clustering [90.8576971748142]
グラフ自動エンコーダ(GAE)モデルは、半教師付きグラフ畳み込みネットワーク(GCN)に基づく
我々は、グラフクラスタリングのための特定のGAEベースのモデルを設計し、その理論、すなわち、埋め込みグラフオートエンコーダ(EGAE)と整合する。
EGAEは1つのエンコーダと2つのデコーダで構成される。
論文 参考訳(メタデータ) (2020-02-20T09:53:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。