論文の概要: AdaGraph: A Graph-Native Clustering Algorithm That Overcomes the Curse of Dimensionality and Enables Scientific Discovery
- arxiv url: http://arxiv.org/abs/2605.16320v1
- Date: Tue, 05 May 2026 01:42:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.884443
- Title: AdaGraph: A Graph-Native Clustering Algorithm That Overcomes the Curse of Dimensionality and Enables Scientific Discovery
- Title(参考訳): AdaGraph: 次元の曲線を克服し、科学的発見を可能にするグラフネイティブクラスタリングアルゴリズム
- Authors: Ahmed Elmahdi,
- Abstract要約: 本稿では,Structure-Centric Machine Learning(SC-ML)パラダイムから生まれたグラフネイティブクラスタリングアルゴリズムであるAdaGraphを紹介する。
AdaGraphは、完全にkNNグラフトポロジー内で動作する。
Graph-SCOPEは、独自のSC-MLコントリビューションとして導入されたトポロジベースのクラスタ妥当性インデックスである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present AdaGraph, a graph-native clustering algorithm born from the Structure-Centric Machine Learning (SC-ML) paradigm -- a new field of unsupervised learning that replaces geometry-centric (distance-based) computation with structure-centric (topology-based) computation, fundamentally dissolving the curse of dimensionality. AdaGraph operates entirely within the kNN graph topology, a representation that retains meaningful relational structure in arbitrarily high dimensions where Euclidean distance metrics become uninformative. AdaGraph requires no a priori specification of the number of clusters k, handles noise natively, and scales via the SLCD (Sample-Learn-Calibrate-Deploy) prototype-deployment framework. As its unsupervised tuning objective, AdaGraph pairs with Graph-SCOPE, the topology-based cluster validity index introduced as a separate SC-ML contribution. On 10 synthetic benchmarks spanning d=10 to d=5000, Graph-SCOPE achieves mean ARI=0.900 and correctly selects k on 9/10 datasets -- outperforming Silhouette, Davies-Bouldin, and Calinski-Harabasz -- while maintaining Kendall tau >= 0.92 with ground-truth cluster quality across all dimensionalities (Silhouette: tau ~= 0.46). We validate AdaGraph across three scientific domains: (1) gene co-expression discovery in hepatocellular carcinoma (GSE14520, 10,000 genes, 488 patients, no dimensionality reduction), where AdaGraph identifies condition-specific gene modules that WGCNA, ICA, NMF, and Spectral Biclustering fail to resolve; (2) natural language text clustering, where AdaGraph achieves ARI=0.751 on 20NG-6cat versus HDBSCAN's 0.464 (62% relative improvement); (3) materials science clustering of superconductors (145-dimensional Magpie features), perovskites, and JARVIS-DFT materials, where AdaGraph achieves the highest Graph-SCOPE on all three datasets.
- Abstract(参考訳): AdaGraphは、Structure-Centric Machine Learning(SC-ML)パラダイムから生まれたグラフネイティブクラスタリングアルゴリズムで、幾何学中心(距離ベース)の計算を構造中心(位相ベース)の計算に置き換え、次元性の呪いを根本的に解消する、教師なし学習の新しい分野である。
AdaGraphは、ユークリッド距離の測度が非形式的になる任意の高次元において有意な関係構造を保持する表現であるkNNグラフトポロジーの中で完全に機能する。
AdaGraphは、クラスタ数kの事前仕様を必要とせず、ノイズをネイティブに処理し、SLCD(Sample-Learn-Calibrate-Deploy)のプロトタイプ-デプロイフレームワークを介してスケールする。
教師なしチューニングの目的として、AdaGraphは、別のSC-MLコントリビューションとして導入されたトポロジベースのクラスタ妥当性指数であるGraph-SCOPEと組み合わせている。
d=10からd=5000の合成ベンチマークでは、Graph-SCOPEは平均ARI=0.900を達成し、Silhouette、Davies-Bouldin、Calinski-Harabaszより優れた9/10データセットのkを正しく選択する。
AdaGraphはWGCNA,ICA,NMF,Spectral Biclusteringが解決できない条件特異的遺伝子モジュールを同定し,AdaGraphは20NG-6catでARI=0.751を達成し,HDBSCANの0.464(相対的改善)に対してAdaGraphはARI=0.751を達成している。
関連論文リスト
- Feature-Enhanced Graph Neural Networks for Classification of Synthetic Graph Generative Models: A Benchmarking Study [0.0]
本稿では,GNNとグラフ理論的特徴を組み合わせたハイブリッド手法を用いて,合成グラフファミリーの分類について検討する。
5つの代表的な家系のグラフからなる大規模かつ構造的に多様な合成データセットを生成する。
ノードレベルの特徴の包括範囲をグラフ毎に抽出し,ランダムフォレストに基づく特徴選択パイプラインを用いて解析する。
評価の結果,GraphSAGEとGTNは98.5%の精度で高いクラス分離を達成できた。
論文 参考訳(メタデータ) (2025-12-20T22:44:29Z) - GraphGSOcc: Semantic-Geometric Graph Transformer with Dynamic-Static Decoupling for 3D Gaussian Splatting-based Occupancy Prediction [2.3239379129613535]
GraphGSOccは、意味グラフと幾何学グラフを組み合わせ、動的静的オブジェクトを分離する新しいフレームワークである。
SurroundOcc-nuScenes、Occ3D-nuScenes、OpenOcc、KITTIの占有ベンチマークで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-06-13T06:09:57Z) - Scalable and Adaptive Spectral Embedding for Attributed Graph Clustering [33.2644557389611]
本稿では,パラメータ学習を伴わない単純な属性グラフクラスタリング手法であるSASEを紹介する。
これらの設計により、SASEはグローバルクラスタ構造を効果的にキャプチャするだけでなく、グラフサイズに対して線形時間と空間の複雑さを示す。
例えば、169Kノードと1.17Mエッジを持つArXivデータセットでは、SASEはACCの6.9%の改善と、ランナアップであるS3GCと比較して5.87タイムのスピードアップを実現している。
論文 参考訳(メタデータ) (2024-08-11T12:57:50Z) - Scalable Graph Compressed Convolutions [68.85227170390864]
ユークリッド畳み込みのための入力グラフのキャリブレーションに置換を適用する微分可能手法を提案する。
グラフキャリブレーションに基づいて,階層型グラフ表現学習のための圧縮畳み込みネットワーク(CoCN)を提案する。
論文 参考訳(メタデータ) (2024-07-26T03:14:13Z) - Graph Sparsification via Mixture of Graphs [67.40204130771967]
そこで我々はMixture-of-Graphs (MoG)を導入し、各ノードに対して動的に調整されたプルーニングソリューションを選択する。
MoGには複数のスパシファイアの専門家が組み込まれており、それぞれが独自のスパーシリティレベルとプルーニング基準によって特徴付けられ、各ノードに対して適切な専門家を選択する。
5つのGNNを備えた4つの大規模OGBデータセットと2つのスーパーピクセルデータセットの実験により、MoGはより高い空間レベルのサブグラフを識別することを示した。
論文 参考訳(メタデータ) (2024-05-23T07:40:21Z) - Kernel-based Joint Multiple Graph Learning and Clustering of Graph
Signals [2.4305626489408465]
本稿では, Kernel-based Joint Multiple GL and clustering of graph signal applicationを紹介する。
実験により、KMGLは、特に高騒音レベルのシナリオにおいて、GLクラスタリングの堅牢性を大幅に向上することが示された。
これらの知見は,様々な実世界のアプリケーションにおいて,グラフ信号処理法の性能向上のためのKMGLの可能性を明らかにするものである。
論文 参考訳(メタデータ) (2023-10-29T13:41:12Z) - AnchorGAE: General Data Clustering via $O(n)$ Bipartite Graph
Convolution [79.44066256794187]
我々は、グラフ畳み込みネットワーク(GCN)を構築するために使用される生成グラフモデルを導入することにより、グラフに非グラフデータセットを変換する方法を示す。
アンカーによって構築された二部グラフは、データの背後にある高レベル情報を利用するために動的に更新される。
理論的には、単純な更新が退化につながることを証明し、それに従って特定の戦略が設計される。
論文 参考訳(メタデータ) (2021-11-12T07:08:13Z) - Node Feature Extraction by Self-Supervised Multi-scale Neighborhood
Prediction [123.20238648121445]
我々は、新しい自己教師型学習フレームワーク、グラフ情報支援ノード機能exTraction (GIANT)を提案する。
GIANT は eXtreme Multi-label Classification (XMC) 形式を利用しており、これはグラフ情報に基づいた言語モデルの微調整に不可欠である。
我々は,Open Graph Benchmarkデータセット上での標準GNNパイプラインよりもGIANTの方が優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-29T19:55:12Z) - Pseudoinverse Graph Convolutional Networks: Fast Filters Tailored for
Large Eigengaps of Dense Graphs and Hypergraphs [0.0]
Graph Convolutional Networks (GCNs) は、グラフベースのデータセットで半教師付き分類を行うツールとして成功している。
本稿では,三部フィルタ空間が高密度グラフを対象とする新しいGCN変種を提案する。
論文 参考訳(メタデータ) (2020-08-03T08:48:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。